Вы находитесь на странице: 1из 30

13.

1 Estimación de la población desde una muestra

Ver temas de ayuda

> Tabla de distribución normal tipificada N(0,1)

> Manejo de la tabla normal. Casos más frecuentes.

> Tipificación de la variable. Problemas resueltos.

> Distribución de medias muestrales. Fórmulas y ejemplos.

> Intervalo de probabilidad de medias muestrales.

Estimación

Lo habitual es que se desconozca la media y la desviación típica de la población, vamos a


estimar estos parámetros en función de una muestra .

Si desconocemos la desviación típica de la población, utilizamos la desviación típica de la


muestra.

Vamos a calcular el intervalo de confianza para la media poblacional, error máximo


admitido y tamaño de la muestra.

Intervalo de confianza, error y tamaño de la muestra


Ejemplos de intervalo de confianza de una muetra
PROBLEMAS RESUELTOS PRUEBA DE HIPÓTESIS
1)Dada una media de muestra de 83 elementos , una desviación estándar de muestra de 12.5 y un
tamaño de muestra de 22, pruebe la hipótesis de que el valor de la media de la población es 70,
frente a la otra opción de que es más de 70. U

tilice un nivel de significancia de 0.025

SOLUCIÓN:
DATOS

Hipótesis nula:Uo

La media de la población es 70:

Ho:Uo=70

Hipótesis alternativa:H1

La media de la población es más de 70:

H1: Uo>70

Prueba de un extremo:derecho

Nivel de significancia: 0.025

Media de la muestra X =83

Desviación estándar de la muestra :  =12.5

Tamaño de la muestra =22

Como no se conoce la desviación estándar de la población y el tamaño de la muestra es


pequeño, utilizamos la distribución t:
0.5 0.475
0.025
o 50% o 47.5%
o 2.5%

Uo=70

Utilicemos dos maneras:

1. Encontremos los límites de la región de aceptación:

Uo  t x :media hipotetizada más o menos t veces el error estándar

Averigüemos el valor de t:

En la tabla de la distribución t para 21 grados de libertada (n-1, n= tamaño de la muestra)


y para un área de 0.475 (columna de 0.025) se lee un t=2,0796

Ahora encontremos el error estándar respectivo:

ˆ 12.5
x    2,665
n 22
Luego los límites de aceptación de nuestra prueba son:

70  (2,0796)*(2,665)=70  5,54 ; entonces límite inferior de dicho intervalo =70-5.54=64.45

Límite superior = 70+5,54 = 75,54

Entonces: 64,45___________75,54

Y dado que la media de la muestra no se encuentra en este intervalo, porque es 83,


rechazamos la hipótesis nula de que la media de la población es 70 .

Gráficamente tendremos:
83

0.5 0.475
0.025
o 50% o 47.5%
o 2.5%

75,54
Uo=70

83 cae en la zona de rechazo

2. Ahora analicemos el segundo método:


Tiene que ver con los valores estandarizados:

Ya sabemos que el valor de t que limita la zona de aceptación es 2,0796; ahora


comparémoslo con el valor t ( número de errores estándar) dado por el resultado de la
prueba:

x  Uo 83  70
t t  4,878
x o 2,665
vemos que este valor supera los 2,0796 que figura como valor de aceptación. Por lo tanto
este valor (4,87) también nos indica que debemos rechazar la hipótesis nula

( esto es que la media de la población es de 70)

Gráficamente tendremos:
t =4,87

0.5 0.475
0.025
o 50% o 47.5%
o 2.5%

t =2,0796
Uo=70

4,87 cae en la zona de rechazo

2)Una corredora de bienes raíces tomó una muestra aleatoria de 12 hogares de un barrio
de gente acomodada y encontró que el valor de mercado promedio estimado era de
$780.000 con una desviación estándar de $49.000. Pruebe la hipótesis que para todas las
casas del área, el valor estimado medio es de 825.000, frente a la otra opción de que es
menos de $825.000. Utilice un nivel de significancia de 0.05.

SOLUCIÓN
Igual que en el problema anterior debemos utilizar la distribución t ( no se conoce la
desviación estándar de la población y el tamaño de la muestra es pequeño)

DATOS:

Hipótesis nula:Uo

El valor estimado medio es:$825.000

Ho:Uo=$825.000

Hipótesis alternativa:H1
El valor estimado medio es menor de $825.000

H1: Uo<$825.000

Prueba de un extremo:izquierdo

Nivel de significancia: 0.05

Media de la muestra X =$780.000

Desviación estándar de la muestra :  =$49.000

Tamaño de la muestra =12

0.45 0.5
0.05
o 45% o 50%
o 5%

Uo=825.000

Encontremos los límites de la región de aceptación:

Uo  t x :media hipotetizada más o menos t veces el error estándar

Averigüemos el valor de t:

En la tabla de la distribución t para 11 grados de libertada (n-1, n= tamaño de la muestra)


y para un área de 0.45 (columna de 0.05) se lee un t= -1,7959

Ahora encontremos el error estándar respectivo:


ˆ 49000
x    14.145
n 12
Luego:

los límites de aceptación de nuestra prueba son:

825000  25.403,15

(1,7959)*(14.145)=825000  25.403,15 ;entonces:

límite inferior de dicho intervalo de aceptación =

825.000-25.403,15=799.596,85

Límite superior = 825.000+25.403,15

= 850.403,15

Entonces: (799.596,85___________850.403.15)

Y dado que la media de la muestra no se encuentra en este intervalo, porque es 780.000,


rechazamos la hipótesis nula de que la media de la población es 825000 .

Gráficamente tendremos:
=780000

0.45 0.5
0.05
o 45% o 50%
o 5%

799.596
Uo=825.000

780000 cae en la zona de rechazo

2)Ahora analicemos el segundo método:

Tiene que ver con los valores estandarizados:

Ya sabemos que el valor de t que limita la zona de aceptación es

-1,7959; ahora comparémoslo con el valor t ( número de errores estándar) dado por el
resultado de la prueba:

x  Uo 780000 825000
t t  3,1813
x o 14.145
vemos que este valor supera el

– 1,7959 que figura como valor de aceptación. Por lo tanto este valor

(t= -3,1813) también nos indica que debemos rechazar la hipótesis nula

( esto es que la media de la población es 825000)

Gráficamente tendremos:
t = -3,1813

0.45 0.5
0.05
o 45% o 50%
o 5%

-1,7959
Uo=825.000

-3,1813 cae en la zona de rechazo

3)Los siguientes datos corresponden a la longitud medida en centímetros de 18 pedazos


de cables sobrantes en cada rollo utilizado
9,00;3,41;6,13;1,99;6,92;3,12;7,86;2,01;5,98;4,15;6,87;1,97;4,01;3,56;8,04;3,24;5,05;7,37.
Basados en estos datos, ¿podemos decir que la longitud media de los pedazos de cable
es mayor de 4 cms?

Suponga la población normal con desviación estándar de 2,3 y tome un nivel de


significancia de 0.05

SOLUCIÓN
DATOS

Hipótesis nula:Uo

La longitud promedio de los pedazos de cable es cuando más de 4 cms:

Ho:Uo=4 ó también Ho:Uo  4 cms

Hipótesis alternativa:H1

La longitud promedio de los pedazos de cable es mayor de 4 cms

H1: Uo>4

Prueba de un extremo:derecho
Nivel de significancia: 0.05

Media de la muestra X =5,037=5,04

Tamaño de la muestra =18

La distribución a utilizar es la distribución normal:

0.5 0.45
0.05
o 50% o 45%
o 5%

Uo=4

Utilicemos dos maneras:

1)Encontremos los límites de la región de aceptación:

Uo  z x :media hipotetizada más o menos z veces el error estándar


Averigüemos el valor de z:

En la tabla de la distribución normal para un área de 0.45 se lee un

z =1.645 (promedio de dos valores)

Ahora encontremos el error estándar respectivo:

 2,3
x    0.542
n 18
Luego los límites de aceptación de nuestra prueba son:4  (1,645)*(0.542)=4  0.89 ;
entonces límite inferior de dicho intervalo =4-0.89=3,11
Límite superior = 4+0.89 = 4.89

Entonces: 3.11___________4.89

Y dado que la media de la muestra no se encuentra en este intervalo, porque es 5.04,


rechazamos la hipótesis nula de que la media de la población es 4cms .

Gráficamente tendremos:

5.04

0.5 0.45
0.05
o 50% o 45%
o 5%

4.89
Uo=4

5.04 cae en la zona de rechazo

2)Ahora analicemos el segundo método:

Tiene que ver con los valores estandarizados:

Ya sabemos que el valor de z que limita la zona de aceptación es

Z = 1.645; ahora comparémoslo con el valor z ( número de errores estándar) dado por el
resultado de la prueba:

x  Uo 5.04  4
z  z  1.92
x o 0.542
vemos que este valor supera el

z = 1.645 que figura como valor de aceptación. Por lo tanto este valor

(z = 1.92) también nos indica que debemos rechazar la hipótesis nula

( esto es que la media de la población es 4 cms)


Gráficamente tendremos:

Z = 1.92

0.5 0.45
0.05
o 50% o 45%
o 5%

z =1.645
Uo=4

1.92 cae en la zona de rechazo

4)Una fábrica de pilas garantiza que su producto tiene una vida media de 1000 horas y
una desviación estándar de 50 horas. Pruebe la hipótesis de que   1000 en
contraposición a la alterna de que   1000 , si una muestra aleatoria de 30
baterias tiene una duración promedio de 950 horas. Utilice un   5%
SOLUCIÓN
DATOS

Hipótesis nula:Uo

La vida promedio de las baterias es de 1000 horas:

Ho:Uo=1000

Hipótesis alternativa:H1

La vida promedio de las baterias es diferente de 1000 horas

H1:   1000
0

Prueba de dos extremos:


Nivel de significancia:   5%
Media de la muestra X =950 Desviación estándar de la población:

  50

La distribución a utilizar es la distribución normal:

0.025 o

2.5% 0.475 0.475


0.025
o o 47.5%
47.50% o 2.5%

Uo=1000

Utilicemos dos maneras:

1)Encontremos los límites de la región de aceptación:

Uo  z x :media hipotetizada más o menos z veces el error estándar


Averigüemos el valor de z:

En la tabla de la distribución normal para un área de 0.475 se lee un

z =1.96 (promedio de dos valores)

Ahora encontremos el error estándar respectivo:

 50
 x
  9.13
n 30
Luego los límites de aceptación de nuestra prueba son:1000  (1,96)*(9.13)=1000  17.89 ;
entonces límite inferior de dicho intervalo =1000-17.89=982.11
Límite superior = 1000+17.89 = 1017.89

Entonces: 982.11___________1017.89

Y dado que la media de la muestra no se encuentra en este intervalo, porque es 950,


rechazamos la hipótesis nula

Gráficamente sería:

Zona de
=950
aceptación
zona

de rechazo
Zona de
0.025 o
rechazo
2.5% 0.475 0.475
0.025
o o 47.5%
47.50% o 2.5%

982.11 Uo=1000 1017.89

2)Ahora analicemos el segundo método:

Tiene que ver con los valores estandarizados:

Ya sabemos que el valor de z que limita la zona de aceptación es

Z = 1.96; ahora comparémoslo con el valor z ( número de errores estándar) dado por el
resultado de la prueba:

x  Uo
z  950  1000
x o z  5.48
9.13
vemos que este valor supera el

z = - 1.96 que figura como valor de aceptación. Por lo tanto este valor
(z = - 5.48) también nos indica que debemos rechazar la hipótesis nula

( esto es que la media de la población es 1000 horas)

Gráficamente tendremos:

Zona de
Z = -5.48
zona aceptación

de rechazo

Zona de
0.025 o
rechazo
2.5% 0.475 0.475
0.025
o o 47.5%
47.50% o 2.5%

-1,96 Uo=1000 1.96

Lo cual nos indica también que debemos rechazar la hipótesis de que la vida media de las
baterias es de 1000 horas.
PRUEBA DE UNA PROPORCIÓN

Un político puede estar interesado en conocer si ha habido un aumento en la


proporción (porcentaje) de votantes que lo favorecen en las próximas elecciones;
una productor de cereales puede querer conocer si ha ocurrido o no una baja en la
proporción de clientes que prefieren su marca de cereal; un hospital desea confirmar
el reclamo de un manufacturero de medicamentos quien afirma éste cura al 80% de
los usuarios. Estos ejemplos son algunas de las situaciones donde nos interesa
probar alguna afirmación referente a una proporción. El procedimiento para probar
una proporción en una población normal es casi igual al usado para las medias.
¿Cómo probar una proporción?
Podemos usar cualquiera de los siguientes:
1. Método de la región de rechazo (Método 1) ó
2. Método del valor P (Método 2)

A. MÉTODO DE LA REGIÓN DE RECHAZO (MÉTODO 1)


Digamos que po es la proporción aceptada o reclamada.

Paso 1 Establezca las hipótesis. Ho : p = po


H1 : p > po ó
p < po ó
p  po

Paso 2 Use el nivel de significancia () y dibuje la región de rechazo en la


curva normal estándar (curva z).

  /2 /2
ó ó
z -z -z z
(H1 :  > o) (H1 :  < o) (H1 :   o)

 x
Paso 3 Calcule el valor z para la proporción muestral  p   usando la fórmula
 n
p  p0 p0 (1  p0 )
Z= , p 
p n

Paso 4 Dibuje este valor de z en el diagrama de la región de rechazo (Paso 2).


Paso 5 Si el valor z cae dentro de la región de rechazo (sombreada), entonces
rechace Ho. Si cae fuera de la región sombreada, entonces no rechace
Ho.

Paso 6 Escriba la conclusión de la prueba.

Ejemplo 1: Prueba la hipótesis H0 : p = 0.4


H1 : p  0.4
Presuma que = 0.45, n = 200, y  = .01.
Solución:
Paso 1 H0 : p = 0.4
H1 : p  0.4

Paso 2 Usando  = .01, el diagrama de la región de rechazo es:

.005 .005

-2.575 2.575
Paso 3 Calculando el valor z para la proporción muestral p = 0.45), obtenemos:
0.4(1  0.4)
p   0.0346
200
0.45  0.4
Z=  1.45
0.0346
Paso 4 Dibujando z = 1.45 en el diagrama de la región de rechazo (Paso 2)
obtenemos:
1.45

.005 .005

-2.575 2.575
Paso 5 Como el valor z está fuera de la región de rechazo (sombreada), por lo
tanto no rechazamos Ho.

Paso 6 La proporción en la población es 0.4.


B. MÉTODO DEL VALOR P (MÉTODO 2)
Dejemos que p0 sea la proporción aceptada o reclamada.

Paso 1 Establezca las hipótesis: H0 : p = p0


H1 : p > p0 ó
p < p0 ó
p  p0

 x
Paso 2 Calcule el valor z para la proporción muestral  p   usando la
 n
fórmula:
p  p0 p0 (1  p0 )
Z= , donde  p  .
p n

Paso 3 Usando la hipótesis alterna dibuja la región bajo la curva z que


representa los valores extremos.

Valor P ó Valor P ó P/2 P/2

z -z -z z

(H1 :  > o) (H1 :  < o) (H1 :   o)

Paso 4 El valor P = al área de la cola sombreada (s) en el Paso 3.


Paso 5 Si el valor P < , entonces rechaza H0
Si el valor P  , entonces no rechaces H0.

Paso 6 Escribe la conclusión de la prueba.

Ejemplo 1: Pruebe la hipótesis H0 : p = 0.4


H1 : p  0.4
Presuma que = 0.45, n = 200, y  = 0.01.
Solución:
Paso 1 H0 : p = 0.4
H1 : p  0.4

Paso 2 Calculando el valor z de p , obtenemos


0.4(1  0.4)
p   0.0346
200
0.45  0.4
Z=  1.45
0.0346

Paso 3 La región bajo la curva z que contiene los valores extremos de es

P/2 P/2

-1.45 1.45

Paso 4 El valor P = suma de las áreas de las regiones sombreadas en el Paso 3.


= 2(el área a la derecha de 1.45)
= 2(0.5 – .4265)
= 0.147
Paso 5 Como el valor P es mayor que , entonces no podemos rechazar H0.

Paso 6 La proporción en la población es 0.4.

EJERCICIOS
En los ejercicios (1-5) use el método de la región de rechazo para probar la
hipótesis.

1. H0 : 0.6
H1 : p  0.6, = 0.65, n = 100, y  = 0.01

2. H0 : p = 0.29
H1 : p  0.29, = 0.26, n = 90, y  = 0.01

3. H0 : p = 0.36
H1 : p < 0.36, = 0.34, n = 630, y  = 0.05

4. Un manufacturero de juguetes Tailandés reclama que solo un 10% de los osos


de juguete hechos para hablar están defectuosos. Cuatrocientos de éstos
juguetes se sometieron a prueba de forma aleatoria y se encontró que 50
estaban defectuosos. Pruebe el reclamo del manufacturero con un nivel de
significancia de 5%.

5. Una agencia de empleos afirma que el 80% de todas las solicitudes hechas por
mujeres con hijos prefieren trabajos a tiempo parcial. En una muestra
aleatoria de 200 solicitantes mujeres con niños, se encontró que 110
prefirieron trabajos a tiempo parcial. Pruebe la hipótesis de la agencia con un
nivel de significancia de 5%.

En los ejercicios (6 - 10) use el método del valor-p para pruebas de hipótesis.
6. H0 : p = 0.2
H1 : p > 0.2, = 0.245, n = 400, y  = 0.01

7. H0 : p = 0.55
H1 : p < 0.55, x = 175, n = 300, y  = 0.05

8. H0 : p = 0.2
H1 : p  0.2, x = 235, n = 1000, y  = 0.02

9. Nacionalmente, un 16 % de los hogares tiene una computadora personal. En


una muestra aleatoria de 80 hogares en Baltimore, solo 13 poseían una
computadora personal. Con un nivel de significancia de 5%, pruebe si el
porciento de hogares en Baltimore que tienen computadoras personales es
menor que el porcentaje nacional.

10. El registrador de cierta universidad ha dicho que esta dispuesto a permitir una
sección del curso ESTAD 121 una vez a la semana si más del 65% de los
estudiantes matriculados en el curso expresan que prefieren el curso una vez a
la semana, en vez de dos veces a la semana. En una muestra aleatoria de 40
estudiantes, 26 indicaron su preferencia de una vez a la semana. Usando un
nivel de significancia de 0.01, debe el registrador autorizar el ofrecimiento del
curso ESTAD 121 una vez a la semana?

Modulo 16

PRUEBAS DE HIPÓTESIS
Usualmente =0.1, 0.05 ó 0.01, que corresponden a intervalos de confianza del 90, 95 y 99 por ciento
respectivamente. La siguiente tabla muestra los Z/2 más usados. Compruébelos

Nivel de Confianza Z/2


90 1.645
95 1.96
99 2.58
En este problema la fábrica de llantas tiene dos turnos de operarios, turno de día y turno mixto. Se selecciona
una muestra aleatoria de 100 llantas producidas por cada turno para ayudar al gerente a sacar conclusiones de
cada una de las siguientes preguntas

- ¿Es la duración promedio de las llantas producidas en el turno de día igual a 25 000 millas?
- ¿Es la duración promedio de las llantas producidas en el turno mixto menor de 25 000 millas?
- ¿Se revienta más de un 8% de las llantas producidas por el turno de día antes de las 10 000 millas?

Prueba de Hipótesis para la media. En la fábrica de llantas la hipótesis nula y alternativa para el problema se
plantearon como,

Ho: μ = 25 000 H1: μ ≠ 25 000

Si se considera la desviación estándar σ las llantas producidas en el turno de día, entonces, con base en el
teorema de limite central, la distribución en el muestreo de la media seguiría la distribución normal, y la
prueba estadística que esta basada en la diferencia entre la media X de la muestra y la media μ hipotética
se encontrara como

x  o
Z
/ n

Si el tamaño de la región α de rechazo se estableciera en 5% entonces se podrían determinar los valores


críticos de la distribución. Dado que la región de rechazo esta dividida en las dos colas de la distribución, el
5% se divide en dos partes iguales de 2.5%.

Dado que ya se tiene la distribución normal, los valores críticos se pueden expresar en unidades de
desviación. Una región de rechazo de 0.25 en cada cola de la distribución normal, da por resultado un área
de .475 entre la media hipotética y el valor crítico. Si se busca está área en la distribución normal, se
encuentra que los valores críticos que dividen las regiones de rechazo y no rechazo son + 1.96 y - 1.96

Por tanto, la regla para decisión sería rechazar Ho si Z > +1.96 o sí z < -1.96, de lo contrario, no rechazar Ho.
Para una muestra de 100, si se selecciona un nivel de significancía de 0.05, los valores críticos de la
distribución t con 100-1= 99 grados de libertad se puede obtener como se indica en la siguiente tabla tenemos
el valor de 1.9842. Como esta prueba de dos colas, la región de rechazo de 0.05 se vuelve a dividir en dos
partes iguales de 0.025 cada una. Con el uso de las tablas para t, los valores críticos son –1.984 y +1.984. La
regla para la decisión es,

Rechazar Ho si t 99  1.9842 o t 99  1.9842 de lo contrario, no rechazar Ho


Los resultados de la muestra para el turno de día (en millas) fueron
X dìa  25.430, Sdìa  4.000 y n día  100 millas. Puesto que se esta probando si la media es
diferente a 25 000 millas, se tiene con la ecuación
X  25.430  25.00
t n 1  t 1001   1.075
S/ n 4.000 / 100

Dado que t100-1=1.075, se ve que -1.984 < +1.075 < + 1.984, entonces no se rechaza Ho.

Por ello, la decisión de no rechazar la hipótesis nula Ho. En conclusión es que la duración promedio de las
llantas es 25 000 millas. A fin de tener en cuenta la posibilidad de un error de tipo II, este enunciado se
puede redactar como no hay pruebas de que la duración promedio de las llantas sea diferente a 25 000
millas en las llantas producidas en el turno de día.

PRUEBA DE HIPÓTESIS PARA PROPORCIONES

El gerente de la fábrica de llantas quiere que la calidad de llantas producidas, sea lo bastante alta para que
muy pocas se revienten antes de las 10.000 millas. Si más de un 8% de las llantas se revientan antes de las
10.000 millas, se llegaría a concluir que el proceso no funciona correctamente. La hipótesis nula y alternativa
se pueden expresar como sigue:

H 0  P  0.08 (Funciona correctamente)

H1  P  0.08 (No funciona correctamente)

La prueba estadística se puede expresar en términos de la proporción de éxitos como sigue:

Ps  P X
Z  Ps 
Pq n
n
siendo X y N el número de éxitos de la muestra y n el tamaño de la muestra, P la proporción de éxitos de la
hipótesis nula. Ahora se determinará si el proceso funciona correctamente para las llantas producidas para el
turno de día. Los resultados del turno de día indican que cinco llantas en una muestra de 100 se reventaron
antes de 10,000 millas para este problema, si se selecciona un nivel de significancia   0.05 , las regiones
de rechazo y no rechazo se establecerían como a continuación se muestra. Y la regla de decisión sería:
Rechazar Ho si z> + 1.645; de lo contrario no rechazar H o. Con los datos que se tienen,
Ps  P
Ps  0.05  Z   1.107
Pq
n
una vez reemplazado, recuerde p+q=1
Z=-1.107 +1.645; por tanto no rechazar Ho.

La hipótesis nula no se rechazaría por que la prueba estadística no ha caído en la región de rechazo. Se
llegaría a la conclusión de que no hay pruebas de que más del 8% de las llantas producidas en el turno de día
se revienten antes de 10,000 millas. El gerente no ha encontrado ninguna prueba de que ocurra un número
excesivo de reventones en las llantas producidas en el turno de día.

TEST DE HIPÓTESIS ESTADÍSTICA


Ejemplo. Una industria usa como uno de los componentes de las máquinas de producción una lámpara
especial importada que debe satisfacer algunas exigencias. Una de esas exigencias está relacionada a su vida
útil en horas. Esas lámparas son fabricadas por dos países y las especificaciones técnicas varían de país a país.
Por ejemplo el catálogo del producto americano afirma que la vida útil media de sus lámparas es de 15500
horas, con un SD de 1200. Mientras que para el producto europeo la media es de 16500, y el SD es de 2000.

Un lote de esas lámparas de origen desconocido es ofrecido a un precio muy conveniente. Para que la
industria sepa si hace o no una oferta ella necesita saber cual es el país que produjo tales lámparas. El
comercio que ofrece tales lámparas afirma que será divulgada la vida útil media de una muestra de 25
lámparas del lote antes de la oferta. ¿Que regla de decisión deben usar los responsables de la industria para
decir que las lámparas son de procedencia americana o europea?. Una respuesta que surge inmediatamente es
la de considerar como país productor aquel en la cual la media de la muestra se aproxima más a la media de
la población. Así, la decisión sería si x  16000 (el punto medio entre 15500 y 16500) diremos que es de
procedencia americana; en caso contrario diremos que es de procedencia europea.

Suponga que en el día de la licitación se informó que, de acuerdo con la regla de decisión diríamos que las
lámparas son de origen americano. ¿Podemos estar herrados en esa conclusión?. O en otras palabras, ¿es
posible que una muestra de 25 lámparas de origen europeo presente una media de 15800? Si, es posible.
Entonces, para un mejor entendimiento de la regla de decisión adoptada, es interesante estudiar los tipos de
errores que podemos cometer y las respectivas probabilidades de cometer esos errores.

En el ejemplo las hipótesis consideradas son


Ho Las lámparas son de origen europeo, esto equivale a decir que la vida útil X de cada lámpara sigue una
distribución con media =16500 horas y un SD=2000 horas.
H1; Las lámparas son de origen americano, es decir la media poblacional = 15500 horas con un SD=1200
horas.

Retomando el ejemplo vamos a indicar por RC una región determinada por los valores de X menores que
16000, es decir RC={X  16000}. El valor 16000 se denomina punto crítico y se denotará como xc.
Con las notaciones indicadas arriba, la probabilidad de cometer cada uno de los errores puede ser escrito del
siguiente modo:
- P[Error Tipo I] = P[ X pertenezca a RC | H0 es verdadera] = .
- P[Error Tipo II] = P[ X no pertenezca a RC | H0 es falsa ] = 
Ejemplo. En el ejemplo anterior, cuando H0 es verdadera, es decir, las lámparas son de origen europea,
sabemos del teorema central del límite que x , o sea la media de las muestras de tamaño 25, tendrán
2000
distribución aproximadamente normal con media 16500 y  =  400 , es decir X  N(16500, 1600).
25
Entonces,

P[Error Tipo I] = P[ X  RC | H0 es verdadera] =


= P[ X  16000 | X  N(16500, 1600)] = P[ Z  (16000 – 16500)/ 400]
= P[ Z  -1.25] = 0.106 = 10.6%.

Para cada regla de decisión adoptada, es decir, para cada valor crítico xc se obtiene un valor de probabilidad
de error tipo 1. Por otra parte, si xc se elige menor que 15000  disminuye pero  aumenta.
Sin embargo, se puede proceder de manera inversa, es decir, fijado  encontramos la regla de decisión que
corresponderá a una probabilidad de error 1 igual a .

Ejemplo. Si se toma  = 5%, y se procede a encontrar la regla de decisión correspondiente:


5%= P[Error Tipo I]= P[ X  xc | X  N(16500, 1600)] = P[Z < -1.645],
pero se sabe que, para una distribución normal estándar
x c  16500
 1.645 
400
de donde xc = 15842 horas. Entonces, la regla de decisión será

“Si X fuera inferior a 15842 se dice que el lote es americano, en caso contrario se dice que es europeo”.
Con esta regla la probabilidad de error tipo II será
P[Error Tipo II] = P[ X > 15842 | X  N(16500, 1600)] = P[Z > 1.425] = 7.93%
CONTRASTES DE HIPÓTESIS

Ejemplo, Supongamos que debemos realizar un estudio sobre la altura media de los habitantes de cierto
pueblo. Antes de tomar una muestra, lo lógico es hacer la siguiente suposición a priori, (hipótesis que se desea
contrastar y que denotamos H0):

H0: la altura media no difiere del resto del país

Al obtener una muestra de tamaño n=8, podríamos encontrarnos ante uno de los siguientes casos:
1. Muestra = {1,50 ;1,52; 1,48; 1,55; 1,60; 1,49; 1,55; 1,63}

2. Muestra = {1,65; 1,80; 1,73; 1,52; 1,75; 1,65; 1,75; 1,78}

CONTRASTES PARA LA MEDIA


Ejemplo. Conocemos que las alturas X de los individuos de una ciudad, se distribuyen de modo gaussiano.
Deseamos contrastar con un nivel de significación de =5% si la altura media es diferente de 174 cm. Para
ello nos basamos en un estudio en el que con una muestra de n=25 personas se obtuvo: media 170 y
desviación 10

Solución: El contraste que se plantea es:


H0:= H1:≠174

La técnica a utilizar consiste en suponer que H0 es cierta y ver si el valor que toma el estadístico
X  174
Texp   t 24
ŝ n

es razonable o no bajo esta hipótesis, para el nivel de significación dado. Aceptaremos la hipótesis alternativa
(y en consecuencia se rechazará la hipótesis nula) si no lo es, es decir, si
Texp  t 1 / 2, 24  t 0.975, 24  2.06

Para ello procedemos al cálculo de Texp con s=10, y n=25


n 25
ŝ  s 10  10.206 entonces
n 1 24
170  174
Texp   1.959  2.06
10.206 25
Luego, aunque podamos pensar que ciertamente el verdadero valor de  no es 174, no hay una evidencia
suficiente para rechazar esta hipótesis al nivel de confianza del 95%. Es decir, no se rechaza H0.

El valor de Texp no está en la región crítica (aunque ha quedado muy cerca), por tanto al no ser la evidencia
en contra de H0 suficientemente significativa, ésta hipótesis no se rechaza.
Ejemplo. Se desea comparar la actividad motora espontánea de un grupo de 25 ratas control y otro de 36 ratas
desnutridas. Se midió el número de veces que pasaban delante de una célula fotoeléctrica durante 24 horas.
Los datos obtenidos fueron los siguientes:

Ratas de control n1=25 x 1 =869.8 S1=106.7


Ratas Desnutridas n2=36 x 2 =465 S2=153.7

¿Se observan diferencias significativas entre el grupo control y el grupo desnutrido?

Solución: En primer lugar, por tratarse de un problema de inferencia estadística, nos serán más útiles las
cuasivarianzas que las varianzas. Por ello calculamos:
n 1 2 25 n 2 2 36
ŝ12  s1  106.7  11.859 ŝ 22  s 2  153.7  24.298
2 2

n1  1 24 n 2 1 35

En este caso:
ŝ 22
Fexp   2.049  Fn 2 1,n1 1 Fteo  2.97
ŝ12

Como Fexp≤Tteo, no podemos concluir (al menos al nivel de significación =5%) que H0 deba ser rechazada.

calculamos en primer lugar la cuasivarianza muestral ponderada y los valores del test:
(n 1  1)ŝ12  (n 2  1)ŝ 22
ŝ 
2
 19.238
n1  n 2  2
x1  x 2
Texp   11.210  t n1  n 2 2  t 59
1 1
ŝ 
n1 n 2
Como Tteo  Texp concluimos que se ha de rechazar la hipótesis de igualdad de las medias, y por tanto
aceptamos que las medias son diferentes.

Вам также может понравиться