Вы находитесь на странице: 1из 21

UNIDAD III

ESTADÍSTICA INFERENCIAL

1) INTRODUCCIÓN A LA PRUEBA DE HIPÓTESIS

La estadística inferencial es el proceso de usar la información de una muestra para describir el estado de una
población. Sin embargo es frecuente que usemos la información de una muestra para probar un reclamo o
conjetura sobre la población. El reclamo o conjetura se refiere a una hipótesis. El proceso que corrobora si
la información de una muestra sostiene o refuta el reclamo se llama prueba de hipótesis.
HIPÓTESIS Y NIVELES DE SIGNIFICANCIA
En la prueba de hipótesis se pone a prueba un reclamo hecho sobra la naturaleza de una población a base de la
información de una muestra. El reclamo se llama hipótesis estadística.

Hipótesis Estadística: Una hipótesis estadística es un reclamo hecho sobre la naturaleza de una población.
Por ejemplo, la premisa formulada por un productor de baterías para autos de que su batería dura por lo menos
48 meses, es una hipótesis estadística porque el manufacturero no inspecciona la vida de cada batería que él
produce.
Si surgieran quejas de parte de los clientes, entonces se pone a prueba el reclamo del manufacturero. La
hipótesis estadística sometida a prueba se llama la hipótesis nula, y se denota como H0.
COMO ESTABLECER LA HIPÓTESIS NULA Y LA ALTERNA
Hipótesis Nula (H0): premisa, reclamo, o conjetura que se pronuncia sobre la naturaleza de una o varias
poblaciones.
Por ejemplo, para aprobar o desaprobar el reclamo pronunciado por el productor de baterías debemos probar
la hipótesis estadística de que  48. Por lo tanto, la hipótesis nula es:

H0 :  48.
Luego se procede a tomar una muestra aleatoria de baterías y medir su vida media. Si la información obtenida
de la muestra no apoya el reclamo en la hipótesis nula (H0), entonces otra cosa es cierta. La premisa alterna a
la hipótesis nula se llama hipótesis alterna y se representa por H1.

Hipótesis Alterna: Una premisa que es cierta cuando la hipótesis nula es falsa.
Por ejemplo, para el productor de baterías
H0 :  48 y
H1 :  < 48

Para probar si la hipótesis nula es cierta, se toma una muestra aleatoria y se calcula la información, como el
promedio, la proporción, etc. Esta información muestral se llama estadística de prueba.
Estadística de Prueba: Una estadística de prueba se basa en la información de la muestra como la media o
la proporción.
ERROR TIPO 1 Y ERROR TIPO 2

A base de la información de una muestra nosotros podemos cometer dos tipos de errores en nuestra decisión.
1. Podemos rechazar un H0 que es cierto.
2. Podemos aceptar un H0 que es falso.
El primero se llama error Tipo 1
Prof. Jessica Oliva G. Estadística y probabilidades 1
Error Tipo 1: Cuando rechazamos una Hipótesis Nula que es cierta cometemos error tipo 1.
Y el segundo error se llama error Tipo 2.
Error Tipo 2: Cuando aceptamos una Hipótesis Nula que es falsa cometemos error tipo 2.

NIVEL DE SIGNIFICANCIA ()

Para ser muy cuidadosos en no cometer el error tipo 1, debemos especificar la probabilidad de rechazar H 0,
denotada por . A ésta se le llama nivel de significancia.

Nivel de Significancia: La probabilidad ( más alta de rechazar H0 cuando H0 es cierto se llama nivel de
significancia.
Comentario: Para mantener la probabilidad de cometer el error tipo 1 baja, debemos escoger un valor pequeño
de .

Usando un valor pre asignado de  se construye una región de rechazo o región crítica en la curva normal
estándar o en la curva t que indica si debemos rechazar H0.

Región Crítica o de Rechazo: Una región crítica o de rechazo es una parte de la curva de z o de la curva t
donde se rechaza H0.

La región puede ser de una cola o de dos dependiendo de la hipótesis alterna.

Ejemplos: Para H1:  > valor aceptado, la región de rechazo está dada por:


(Cola derecha, z ó t)

Para H1 :  < valor aceptado, la región de rechazo está dada por:


(Cola izquierda, z ó t)

Para H1 :   valor aceptado, la región de rechazo es de dos colas y está dada por:

(2-colas, z ó t)
/2 /2

Ejemplo 1: Determine si la región de rechazo es de la cola derecha, de la cola izquierda o de dos colas.
a. H0 :  = 15, H1 :   15, =.05

b. H0 : p  0.7, H1 : p > 0.7, =.02

Solución: La forma de la región de rechazo está determinada por la hipótesis alterna.

Prof. Jessica Oliva G. Estadística y probabilidades 2


a. H1 :   15 significa que la región está en ambas colas.

0.05/2 0.05/2

b. H1 : p > 0.7 significa que la región está en la cola derecha.

0.02

Ejemplo 2: En el Ejemplo 1a, presumamos que la región de rechazo es parte de la curva normal estándar.
Complete el dibujo de la región crítica para los valores  siguientes:

a. = 0.05

Solución:
a. Del ejemplo 1(a), tenemos:

Utilizando la función en Excel el valor de Z = 1.96. Por


0.05/2=0.025 0.05/2=0.025 ser dos colas se asigna el signo negativo a la izquierda y
positivo a la derecha.

-1.96 1.96

Ejemplo 3: En el ejemplo la, presumamos que la región de rechazo es parte de la curva t. Complete el dibujo
de la región de rechazo para:
a.  = 0.05 y g.l = 14

Solución:

a. Del ejemplo 1(a),  = 0.05, y g.l = 14, tenemos:

Utilizando la función en Excel el valor de t = 2.145.


0.05/2=0.025 0.05/2=0.025
Por ser dos colas se asigna el signo negativo a la
izquierda y positivo a la derecha.
-2.145 2.145

Ejemplo 4: Establezca las hipótesis nula y alterna.


a) Las millas por galón (mpg) promedio de un nuevo modelo de automóvil es 30.
b) Por lo menos el 68% de los empleados de un colegio aportan a Fondos Unidos.
c) En promedio, los empleados de cierta compañía viven a no más de 16 millas de la misma.

Solución:
a. H0 :  = 30 b. H0 : p  0.68 c. H0 :   16
H1 :   30 H1 : p < 0.68 H1 :  > 16

Prof. Jessica Oliva G. Estadística y probabilidades 3


CALCULO DE Z O T PARA PRUEBA DE HIPOTÈSIS

VALOR Z

PRUEBA UNILATERAL (UNA COLA): =DISTR.NORM.ESTAND.INV (1 - 𝛼)


PRUEBA BILATERAL (DOS COLAS): =DISTR.NORM.ESTAND.INV (1 - 𝛼/2)

VALOR T

PRUEBA UNILATERAL (UNA COLA): = DISTR.T.INV(2𝛼, GL),


PRUEBA BILATERAL (DOS COLAS): = DISTR.T.INV(𝛼, gl),

Donde 𝛼 = 𝑝𝑟𝑜𝑏𝑎𝑏𝑖𝑙𝑖𝑑𝑎𝑑; gl = grados de libertad


Cuando se trabaja con una muestral  gl. = n - 1
Cuando se trabaja con dos muestras  gl. = n1 + n2 – 2

EJERCICIOS PROPUESTOS

En los ejercicios (1-6) determine si la región de rechazo para la hipótesis nula está en la cola izquierda,
en la cola derecha, o ambas colas. Para el nivel de significancia  dibuje la región de rechazo.

1. H0 :   15; H1 :  > 15 4. H0 :  6.4; H1 :  < 6.4

2. H0 : p = 0.2; H1 : p  0.2 5. H0 :  = 90; H1 :  90

3. H0 : p  0.5; H1 : p < 0.5 6. H0 : p  0.6; H1 : p < 0.6

En los ejercicios (7 - 18) complete la región de rechazo (encuentre el valor de z y t).

7.  a) z, si  = 0.05 b) t, si  = 0.025 y g.l.= 11

8.  a) z, si  = 0.01 b) t, si  = 0.05 y g.l. = 9

9.  a) z, si  = 0.02b) t, si  = 0.01 y g.l. = 7

10.  a) z, si  = 0.025 b) t, si  = 0.01 y g.l. = 13

Prof. Jessica Oliva G. Estadística y probabilidades 4


11. /2 a) z, si  = 0.05 b) t, si =0.05 y g.l. = 12
/2

12. a) z, si  = 0.01 b) t, si =0.1 y g.l. = 8


/2 /2

En los ejercicios (13 - 18) establezca las hipótesis nula y alterna.

13. Los automóviles estacionados en el estacionamiento de periodo prolongado del aeropuerto internacional
de Baltimore permanecen un promedio de al menos 3.5 días.

14. Una nueva marca de llantas radiales dura en promedio más de 45,000 millas.

15. El balance promedio de una cuenta de cheques en el First State Bank es por lo menos $165.

16. Se reclama que el 65% de las compras realizadas en cierta tienda por departamentos son artículos de
especiales.

17. Se reclama que al menos el 25% de los graduados de cierto colegio privado solicitan admisión a escuelas
de medicina.

18. Un dentista reclama que el 8% de sus pacientes sufren enfermedades en las encías.

Prof. Jessica Oliva G. Estadística y probabilidades 5


2) TEMA: PRUEBA DE HIPÓTESIS Y ESTIMACIÓN

INTRODUCCIÓN
Un Contraste o Test de Hipótesis es una técnica de Inferencia Estadística que permite comprobar si la
información que proporciona una muestra observada concuerda (o no) con la hipótesis estadística formulada
sobre el modelo de probabilidad en estudio y, por tanto, se puede aceptar (o no) la hipótesis formulada.
Llamaremos hipótesis estadística a una afirmación respecto a una característica de una población. Contrastar
una hipótesis es comparar las predicciones que se deducen de ella con la realidad que observamos: si hay
coincidencia, dentro del margen de error admisible, mantendremos la hipótesis; en caso contrario, la
rechazaremos. La hipótesis estadística puede ser:
Paramétrica: es una afirmación sobre los valores de los parámetros poblacionales desconocidos. Las hipótesis
paramétricas se clasifican en:
Simple: si la hipótesis asigna valores únicos a los parámetros
Compuesta: si la hipótesis asigna un rango de valores a los parámetros poblacionales desconocidos
No Paramétrica: es una afirmación sobre alguna característica estadística de la población en estudio. Por
ejemplo, las observaciones son independientes, la distribución de la variable en estudio es normal, la
distribución es simétrica.
La hipótesis que se contrasta se denomina hipótesis nula y, normalmente, se denota por H0. Si se rechaza la
hipótesis nula es porque se asume como correcta una hipótesis complementaria que se denomina hipótesis
alternativa y se denota por H1 o Ha.
Rechazar una hipótesis implica sustituirla por otra capaz de explicar los datos observados.

Es interesante tener en cuenta que la veracidad de una hipótesis no puede ser probada nunca. Lo que se puede
hacer es afirmar que tiene tal o cual probabilidad de ser falsa. Si esa probabilidad es muy alta (95% o 99%)
por ejemplo, se concluye que la hipótesis es poco creíble y se califica provisoriamente como falsa. Si no se
consigue "falsar" (rechazar) la hipótesis, se acepta provisionalmente como verdadera. Esta calidad de
provisorias de las conclusiones estadísticas no debería sorprender a nadie: toda la ciencia es un constructo
provisorio. La verificación de hipótesis es el proceso que lleva a juzgar la credibilidad de afirmaciones
(hipótesis) relativas a las poblaciones (habitualmente a sus parámetros) de las que fueron extraídas las
muestras.

Prof. Jessica Oliva G. Estadística y probabilidades 6


Ejemplificando
La Hipótesis nula puede ser: un parámetro θ que tiene un valor k y la Hipótesis alternativa será su negación.
Es decir:
Ho: θ = k
H1: θ ≠ k

Una hipótesis es una afirmación acerca de algo. En estadística, puede ser una suposición acerca del valor de
un parámetro desconocido. Una hipótesis estadística es una afirmación respecto a alguna característica de una
población. Contrastar una hipótesis es comparar las predicciones con la realidad que observamos. Si dentro
del margen de error que nos permitimos admitir, hay coincidencia, aceptaremos la hipótesis y en caso contrario
la rechazaremos.

La prueba de hipótesis comienza con una suposición, llamada hipótesis, que hacemos con respecto a un
parámetro de población. Después recolectamos datos de muestra, producimos estadísticos de muestra y usamos
esta información para decidir qué tan probable es que sea correcto nuestro parámetro de población acerca del
cual hicimos la hipótesis. Debemos establecer el valor supuesto o hipotetizado del parámetro de población
antes de comenzar a tomar la muestra. La suposición que deseamos probar se conoce como hipótesis nula, y
se simboliza H0. Siempre que rechazamos la hipótesis, la conclusión que sí aceptamos se llama hipótesis
alternativa y se simboliza H1.

 La hipótesis emitida se suele designar por H0 y se llama Hipótesis nula porque parte del supuesto que la
diferencia entre el valor verdadero del parámetro y su valor hipotético es debida al azar, es decir no hay
diferencia.
 La hipótesis contraria se designa por H1 y se llama Hipótesis alternativa.

Los contrastes pueden ser unilaterales o bilaterales (también llamados de una o dos colas) según
establezcamos las hipótesis, si las definimos en términos de igual y distinto estamos ante una hipótesis
unilateral, si suponemos una dirección (en términos de mayor o menor) estamos ante uno bilateral.

PASOS A SEGUIR EN UNA PRUEBA DE HIPÓTESIS:


Se trata, de extraer conclusiones a partir de una muestra aleatoria y significativa, que permitan aceptar o
rechazar una hipótesis previamente emitida, sobre el valor de un parámetro desconocido de la población. El
método que seguiremos es el siguiente:
1. Definir la hipótesis nula y alternativa: suponer una hipótesis acerca de una población. Se determina si es
una prueba de una o dos cola.
2. Elegir un nivel de significación  y construir la zona de aceptación, intervalo fuera del cual sólo se
encuentran el 100% de los casos más raros. A la zona de rechazo la llamaremos Región Crítica, y su
área es el nivel de significación o aceptación.
3. Verificar la hipótesis extrayendo una muestra cuyo tamaño se ha decidido en el paso anterior y obteniendo
de ella el correspondiente estadístico. Decida que distribución (t o z) es la más apropiada.
4. Regla de rechazo, encuentre los valores críticos adecuados para el nivel de significancia escogido de la
tabla adecuada.
5. Decisión: Rechazar Ho si cumple la regla, caso contrario no rechazaría Ho.
6. Conclusión. Indicar si hay evidencia estadística para probar la hipótesis planteada.

Prof. Jessica Oliva G. Estadística y probabilidades 7


 Hipótesis nula y alternativa
Llamaremos hipótesis nula, y la representaremos por H0, a la hipótesis que se desea contrastar. La
hipótesis nula es en general un supuesto simple que permite hacer predicciones sin ambigüedad. La
hipótesis alternativa (H1 o H1) da una suposición opuesta a aquella presentada en la hipótesis nula. El
experimento se lleva a cabo para conocer si la hipótesis alternativa puede ser sustentada.
La hipótesis H0 nunca se considera probada, aunque puede ser rechazada por los datos. Por ejemplo, la
hipótesis de que todos los elementos de una población tienen el mismo valor de una variable puede ser
rechazada encontrando un elemento que no lo contenga, pero no puede ser “demostrada” más que
estudiando todos los elementos de la población, tarea que puede ser imposible. De igual manera, la
hipótesis de que la media de una población es diez puede ser rechazada fácilmente si la media verdadera
está muy lejos de diez analizando una muestra suficientemente grande. Sin embargo, no puede ser
“demostrada” mediante muestreo, ya que es posible que la media difiera de diez en un valor pequeño
imperceptible en el muestreo). Por esta razón no afirmamos que aceptamos H0, sino que no podemos
rechazarla.

Los tests ( o pruebas) asociados con las hipótesis pueden ser uni o bi laterales,
según las hipótesis planteadas

Ho : θ = k Ho : θ  k Ho : θ ≤ k
H1 : θ ≠ k H1 : θ < k H1 : θ > k

 Estadístico de la prueba
Los datos se deben sintetizar en un estadístico de la prueba. Dicho estadístico se calcula para ver si es
razonablemente compatible con la hipótesis nula. En las pruebas de hipótesis es necesario trazar una línea
entre los valores del estadístico de la prueba que son relativamente probables dada la hipótesis nula y los
valores que no lo son. ¿En qué valor del estadístico de la prueba comenzamos a decir que los datos apoyan
a la hipótesis alternativa? Para contestar a esta pregunta se requiere conocer la distribución muestral del
estadístico de la prueba. Los valores del estadístico de la prueba que son sumamente improbables bajo la
hipótesis nula (tal como los determina la distribución muestral) forman una región de rechazo para la
prueba estadística.

 Interpretación del nivel de significancia.


El propósito de la prueba de hipótesis no es cuestionar el valor calculado del estadístico de la muestra, sino
hacer un juicio respecto a la diferencia entre ese estadístico de muestra y un parámetro de población
hipotetizado. El siguiente paso después de establecer la hipótesis nula y alternativa consiste en decidir qué
criterio utilizar para decidir si aceptar o rechazar la hipótesis nula. Si suponemos que la hipótesis es
correcta, entonces el nivel de significancia indicará el porcentaje de medias de muestra que está fuera de
ciertos límites. Siempre que afirmemos que aceptamos la hipótesis nula, en realidad lo que queremos decir
es que no hay suficiente evidencia estadística para rechazarla. El empleo del término aceptar, en lugar
de rechazar, se ha vuelto de uso común. Significa simplemente que cuando los datos de la muestra n hacen
que rechacemos una hipótesis nula, nos comportamos como si fuera cierta.

Prof. Jessica Oliva G. Estadística y probabilidades 8


 Selección del nivel de significancia.
Nuestra elección del estándar mínimo para una probabilidad aceptable, o el nivel de significancia, es
también el riesgo que asumimos al rechazar una hipótesis nula cuando es cierta. Mientras más alto sea el
nivel de significancia que utilizamos para probar una hipótesis, mayor será la probabilidad de rechazar una
hipótesis nula cuando es cierta.

 Error tipo I y tipo II en contraste de hipótesis


Error tipo I: Llamado también nivel de significación, denotado por , es la probabilidad de rechazar
la Ho cuando ésta es cierta. Es la probabilidad de que le valor de la Estadística caiga en la
Región de Rechazo.
Error tipo II: Denotado por , es la probabilidad de aceptar la Ho cuando ésta es falsa.
Donde (1 - ) se conoce como la potencia de la prueba.

Minimizar los errores no es una cuestión sencilla, un tipo suele ser más grave que otro y los intentos de
disminuir uno suelen producir el aumento del otro. La única forma de disminuir ambos a la vez es aumentar
el tamaño de la muestra.

Decisión Ho Cierta Ho Falsa


Decisión correcta Error tipo II
Aceptar Ho
(1 - ) ()
Error tipo I Decisión correcta
Rechazar Ho
() (1 - )

El rechazo de una hipótesis nula cuando es cierta se denomina error de tipo I, y su probabilidad (que es
también el nivel de significancia) se simboliza como .
El hecho de que P sea muy bajo no califica el acontecimiento como
imposible. Simplemente que tiene poca probabilidad de ocurrir al azar. A
la probabilidad de cometer error tipo I se la denomina nivel de
significación . Habitualmente el investigador fija a priori el nivel de
significación crítico para rechazar Ho (). Si P es menor que , se rechaza.
En caso contrario, se acepta Ho.
El hecho de aceptar una hipótesis nula cuando es falsa se denomina error de tipo II, y su probabilidad se
simboliza como . La probabilidad de cometer un tipo de error puede reducirse sólo si deseamos
incrementar la probabilidad de cometer el otro tipo de error. Con el propósito de obtener una  baja,
tendremos que tolerar una  alta. Los responsables de la toma de decisiones deciden el nivel de
significancia adecuado, al examinar los costos o desventajas vinculadas con ambos tipos de errores
Las hipótesis nula y alternativa son aseveraciones sobre la población que compiten entre sí. O la hipótesis
nula H0 es verdadera, o lo es la hipótesis alternativa H1, pero no ambas. En el caso ideal, el procedimiento
de prueba de hipótesis debe conducir a la aceptación de H0 cuando sea verdadera y al rechazo de H0
cuando H1 sea verdadera. Desafortunadamente no siempre son posibles las conclusiones correctas. Como
las pruebas de hipótesis se basan en información de muestra, debemos considerar la posibilidad de errores.
Debe tenerse en cuenta que sólo se puede cometer uno de los dos tipos de error y, en la mayoría de las
situaciones, se desea controlar la probabilidad de cometer un error de tipo I. Fijar el nivel de
significación equivale a decidir de antemano la probabilidad máxima que se está dispuesto a asumir para

Prof. Jessica Oliva G. Estadística y probabilidades 9


rechazar la hipótesis nula cuando es cierta. El nivel de significación lo elige el experimentador y tiene por
ello la ventaja de tomarlo tan pequeño como desee (normalmente se toma  = 0.10, 0.05 o 0.01)

TIPOS DE PRUEBAS:
Prueba de cola derecha: Si la región de rechazo está a la derecha del puntaje crítico
Prueba de cola izquierda: Si la región de rechazo está a la izquierda del puntaje crítico
Prueba de dos colas o bilateral: Si la región de aceptación es un intervalo abierto entre dos puntajes críticos.

OBSERVACIÓN IMPORTANTE
En ocasiones pueden surgir dudas en el planteamiento de cuál debe ser la hipótesis H0 y cuál
la hipótesis H1, en estos casos debemos tener presente las siguientes reglas:
Cuando el problema de manera expresa pide que se contraste una hipótesis con determinado
nivel de significación, la hipótesis que contrastamos es la hipótesis H0.
Cuando el problema pide explícitamente que seamos nosotros quienes planteemos las
hipótesis, para decidir qué poner en H0 y qué en H1, se pueden tener en cuenta las siguientes
indicaciones:
En H1 siempre debemos colocar lo que realmente queremos investigar con seguridad, pues el
error, el que fijamos de antemano, se comete cuando optamos por H1 y nos equivocamos.
En caso de duda, siempre elegir un contraste de hipótesis con dos colas.

 PRUEBA DE HIPÓTESIS ACERCA DE LA MEDIA POBLACIONAL ()


El estadístico de prueba se basa en la media muestral X , por lo que también se supondrá que la población
está distribuida de manera normal o que se aplican las condiciones del teorema del límite central. Esto
significa que la distribución de X es aproximadamente normal con una media μ y una varianza σ2/n.

Cuadro resumen

Reglas de decisión (o regiones óptimas) para docimar


Tipos de prueba Hipótesis alternante Se rechaza Ho, si
Cola izquierda H1 :  < o Zc < -Z1- tc < -tt
Cola derecha H1 :  > o Zc > Z1- tc > tt
Dos colas H1 :   o |Zc| > Z1-/2 |tc| > tt
x  0 x  0
Estadísticas: Zc  tc  , n-1 grados de libertad
/ n s/ n

Se usa la Estadística Z, si:


a) La muestra es grande, varianza poblacional conocida y población normal o no.
b) La muestra es grande, varianza poblacional desconocida (s  ) y población normal o no.
c) La muestra es pequeña, varianza poblacional conocida y poblacional normal.

Se usa la estadística t, si:


a) La muestra es pequeña
b) Varianza poblacional desconocida
c) Poblacional Normal

Prof. Jessica Oliva G. Estadística y probabilidades 10


Ejemplo: Se pretende diseñar una prueba de hipótesis con una muestra de 74 automóviles para comprobar su
capacidad de frenado. Para ello se medirá en todos ellos la distancia de frenado si el automóvil parte de una
velocidad inicial de 100 Km/h. Se quiere saber si, tras un frenazo brusco, la distancia media recorrida antes de
pararse es de 110 metros. Se supone que la distancia de frenado sigue una distribución normal con desviación
típica conocida σ = 3 m y al realizar efectivamente la prueba a los 74 automóviles se ha obtenido una distancia
promedio de frenado de 111.62 m

Lo primero que se debe realizar es plantearse las hipótesis:


Ho: La media de la distribución es 110 m. ( = 100m)
H1: La media de la distribución no es 110 m. ( ≠ 100m)
El nivel de significancia de 0.05 por tabla se sabe que
Z1-/2 = ± 1.96; n = 74; x =111.62; 0 = 110.0;  = 3.0 ahora se aplica la fórmula:

Regla de Decisión: “Se rechaza la hipótesis Nula H0, si los valores de:
|Zc| > Z1-/2 = Z c  Z1 2 ..o..Z c   Z1 2 es decir, Z c  1.96..o..Z c  1.96 .”

X  0 111.62  110
Zc   Zc   4.65
 n 3 74

Conclusión: Como este valor no entra dentro de la región de aceptación (−1.96, 1.96) nos decidimos por la
hipótesis alternativa H1. Concluimos que la media de frenado no es 110 m.

EJEMPLO: Los sistemas de escape de emergencia para aviones son impulsados por un combustible sólido.
Una de las características importantes de este producto es la rapidez de combustión. Las especificaciones
requieren que la rapidez promedio de combustión sea de 50 cm/s. Se sabe que la desviación estándar de esa
rapidez es de σ = 2 cm/s. El experimentador decide especificar un nivel de significancia, de  = 0.05.
Selecciona una muestra aleatoria de n = 25 y obtiene una rapidez promedio muestral de combustión de x
=51.3 cm/s. ¿A qué conclusión debe llegarse?

El parámetro de interés es μ, la rapidez promedio de combustión.


Ho:  = 50 cm/s
H1:  > 50 cm/s
Por tabla se sabe que para pruebas de una sola cola Z1  1,645;
n = 25; σ = 2 cm/s; x =51.3 cm/s; 0 = 50 cm/s;

Regla de Decisión: “ Se rechaza la hipótesis Nula H0, si el valor de Z c  Z1 , es decir, Z c  1,645.”

Prof. Jessica Oliva G. Estadística y probabilidades 11


Ahora se aplica la fórmula para estandarizar los valores así:

X  0 51.3  50 1.3
Z    3.25
 n 2 25 25

Conclusión: Como Z c es mayor que Z1 , es decir, Z c  3.25  1,645, se rechaza H 0 :   50 con un
nivel de significancia de 0.05. De hecho, se observa una evidencia fuerte de que la rapidez promedio de
combustión es mayor que 50 cm/s.

EJEMPLO: La vida útil promedio de los focos marca general electric especial para vehículos es cuando
menos de 4200 horas. La vida útil promedio para una muestra aleatoria de n = 10 focos es de X  4000 horas,
con una desviación típica muestral de S = 200 horas. Se supone que la vida útil de los focos sigue una
distribución normal. El fabricante desea hacer un contraste de hipótesis con un nivel de significancia de 5 %.
¿Cuál sería la conclusión?

X  4000,..  4200,..S  200,..n  10.


0
SOLUCIÓN: Se ordenan los datos: Para un contraste de
hipótesis de una sola cola por la izquierda con 7 grados de libertad y un nivel de significancia de 0.05, el valor
de t (punto crítico) es -1.833.

Hipótesis:

H 0 :   4200
H1 :   4200

Regla de decisión o Región crítica:


Se rechaza la Hipótesis nula si t c  1,833.

Aplicando la fórmula siguiente se tiene:

X   0 4000  4200
tc    t c  3.16.
S n 200 10

Prof. Jessica Oliva G. Estadística y probabilidades 12


Conclusión: Como t c  3.16  1,833, se rechaza H 0 :   4200 con un nivel de significancia de 0.05.
De hecho, se observa que t c  3.16  1,833 se encuentra en el área de rechaza (ver gráfico). Se concluye
que la vida útil de los focos tiene un promedio inferior a 4200 horas.

INTERVALO DE CONFIANZA PARA LA MEDIA 

1) Varianza 2 supuesta conocida:


Si x es el valor de la media para una muestra aleatoria de tamaño n escogida de una población con varianza
2 supuesta conocida, el intervalo de confianza del (1 - ) x100% para  es:
 
[ x  z1 / 2    x  z1 / 2 ]
n n


Error estándar de la muestra (E.S):  x 
n

Error máximo de estimación de  : e  z1 / 2
n

Nota: Cuando no se conoce la desviación estándar de la población () y la muestra (n) es mayor o igual a
30, se utiliza la desviación estándar de la muestra (s) como su estimador.  = s

2) Varianza 2 supuesta desconocida y n < 30:


Si x y s son la media y la desviación estándar respectivamente para una muestra aleatoria n < 30 escogida
de una población normal con varianza 2 supuesta desconocida, entonces el intervalo de confianza de (1 -
) x100% para  es:

s s
[ x  t1 / 2, n 1    x  t1 / 2, n 1 ]
n n

El valor t (dos colas) se encuentra en la tabla t-student con n-1 grados de libertad o con la funciòn en excel.

Prof. Jessica Oliva G. Estadística y probabilidades 13


 PRUEBA DE HIPÓTESIS ACERCA DE LA DIFERENCIA DE DOS MEDIAS (1-2)

Reglas de decisión (o regiones óptimas) para docimar

Tipos de prueba Hipótesis alternante Se rechaza Ho, si

Cola izquierda H1 :  1 < 2 Zc < -Z1- tc < -tt

Cola derecha H1 :  1 > 2 Zc > Z1- tc > tt

Dos colas H1 : 1  2 |Zc| > Z1-/2 |tc| > tt


Estadísticas:
Varianzas conocidas, muestras grandes
X1  X 2
z
2 2
s1 s
 2
n1 n2

Varianzas desconocidas,
-
Varianzas supuestas iguales 12 = 22 = 2
X1  X 2 (n1  1) S12  (n2  1) S 22
t , S c2  , (n1+ n2 – 2) grados de libertad
sc
2
s
2
n1  n2  2
 c
n1 n2

-
Varianzas supuestas distintas 12  22
2
 S12 S 22 
X1  X 2   
t , r  n1 n2  grados de libertad
2 2 2 2
s1 s S  2
S  2
 2  
1
 
2
n1 n2  n1    n2 
n1  1 n2  1

Se usa la Estadística Z, si:


a) La muestra es grande, varianza poblacional conocida y población normal o no.
b) La muestra es grande, varianza poblacional desconocida (s  ) y población normal o no.
c) La muestra es pequeña, varianza poblacional conocida y poblacional normal.

Se usa la estadística t, si:


a) La muestra es pequeña
b) Varianza poblacional desconocida
c) Poblacional Normal

Prof. Jessica Oliva G. Estadística y probabilidades 14


EJEMPLO: El salario promedio semanal para una muestra de n1  30 empleados de la empresa petrolera
Lasmo es de X 1  280000 Bs., con una desviación típica muestral de S1  14000 Bs. En otra empresa
petrolera grande, una muestra aleatoria de n2  40 empleados tiene un salario promedio semanal de
X 2  270000 Bs., con una desviación estándar muestral de S 2  10000 Bs. Se prueba la hipótesis de que
no existe diferencia entre los salarios promedio semanal de las dos empresas, utilizando un nivel de
significancia de 5 %.
Z 1 2
Lo primero que se hará será ordenar los datos y luego determinar el valor al 5%, de la tabla.
Datos:
Muestra..1.......... .......... .......... .......... ...Muestra..2
n1  30.......... .......... .......... .......... ......... n2  40
X 1  280000.......... .......... .......... ........ X 2  270000
S1  14000.......... .......... .......... .......... ..S 2  10000
El..valor..segun..tabla..de..Z 1 2  1.96

Hipótesis:
H 0 : 1   2
H1 : 1   2

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si  Zc  ≥ 1.96

Aplicando la fórmula siguiente se tiene:

( X1  X 2 ) ( X1  X 2 ) 280000  270000 10000


Zc      Z c  3.33
 12  22 S12 S 22 (14000 ) 2 (10000 ) 2 3005 .56
  
n1 n2 n1 n2 30 40

Conclusión: Como Zc = 3.33 >1.96 se rechaza H 0 : 1   2 con un nivel de significancia de 0.05. Por lo
tanto, los salarios promedios semanales de las dos empresas petroleras son diferentes.

 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS MEDIAS (1 - 2):

CASO: Varianzas 12 y 22 supuestamente conocidas:


Si x1 y x2 son las medias que resultan de dos muestras aleatorias independientes de tamaño n1 y n2 escogidas
aleatoriamente con varianzas 12 y 22 supuestamente conocidas, entonces el intervalo de confianza de (1 - )
x100% de 1 - 2 es:

 12  22  12  22
[( x1  x 2 )  z1 / 2   1   2  ( x1  x 2 )  z1 / 2  ]
n1 n2 n1 n2

CASO: Varianzas 12 y 22 supuestamente desconocidas:

Prof. Jessica Oliva G. Estadística y probabilidades 15


Varianzas supuestas iguales 12 = 22 = 2
Si x1 y x2 son las medias que resultan de dos muestras aleatorias independientes de tamaño n1 y n2 escogidas
aleatoriamente con varianzas 12 y 22 supuestamente desconocidas e iguales, entonces el intervalo de
confianza de (1 - ) x100% de 1 - 2 es:

2 2 2 2
sc s s s
[( x1  x 2 )  t(1 / 2;n1 n2 2)  c  1   2  ( x1  x 2 )  t(1 / 2;n1  n2 2) c  c ]
n1 n2 n1 n2

Donde Sc2 es la varianza común definida por:


(n1  1) S12  (n2  1) S 22
S c2 
n1  n2  2

Varianzas supuestas distintas 12  22


Si x1 y x2 son las medias que resultan de dos muestras aleatorias independientes de tamaño n1 y n2 escogidas
aleatoriamente con varianzas 12 y 22 supuestamente desconocidas y diferentes, entonces el intervalo de
confianza de (1 - ) x100% de 1 - 2 es:

2 2 2 2
s1 s s s
[( x1  x 2 )  t(1 / 2;r )  2  1   2  ( x1  x 2 )  t(1 / 2;r ) 1  2 ]
n1 n2 n1 n2

Donde r son los grados de libertad de la distribución t – student, siendo:

2
 S12 S 22 
  
r   12
n n2 
2
 S12   S 22 
   
 n1    n2 
n1  1 n2  1
Dado que r rara vez es un entero, se redondea al entero más cercano.

Prof. Jessica Oliva G. Estadística y probabilidades 16


 PRUEBA DE HIPÓTESIS DE DOS MUESTRAS EMPAREJADAS

Reglas de decisión (o regiones óptimas) para docimar


Ho: d = 0. Para un nivel de significancia 

Tipos de prueba Hipótesis alternante Se rechaza Ho, si

Cola izquierda H1 : d < 0 tc < -tt


Cola derecha H1 : d > 0 tc > t t
Dos colas H1 : d  0 |tc| > tt
Estadística de prueba
d
t , n-1 grados de libertad
sd
n

Ejemplo: La tabla incluye cinco temperaturas mínimas reales y las correspondientes temperaturas mínimas
que se pronosticaron cinco días antes. Se trata de datos apareados puesto que cada par de valores representa al
mismo día. Las temperaturas pronosticadas parecen ser muy diferentes de las temperaturas reales, pero ¿existe
suficiente evidencia para concluir que la diferencia media no es de cero? Utilice un nivel de significancia de
0.05 para probar la aseveración de que existe diferencia entre las temperaturas mínimas reales y las
temperaturas mínimas pronosticadas cinco días antes.

Temperatura real 1 -5 -5 23 9
Temperatura pronosticada 16 16 20 22 15
d = real - pronosticada -15 -21 -25 1 -6

La aseveración de que existe una diferencia entre las temperaturas mínimas reales y las temperaturas mínimas
pronosticadas para cinco días se expresa como d = 0
Si la aseveración original no es verdadera, tenemos d ≠ 0
Hipótesis:
Ho: d = 0
H1 : d ≠ 0

Regla de decisión o Región crítica:


Se rechaza la Hipótesis nula si tc  2.776

Antes de calcular el estadístico de prueba, debemos calcular los valores de sd y d . Utilizando las fórmulas ya
conocidas anteriormente se tiene que d = -13.2 y sd = 10.7; luego se reemplaza en la fórmula:
d  13.2
t   2.759
sd 10.7
n 5
Conclusión: Como | t c | calculado es menor que t de la tabla, es decir, tc  2.759  2.776, no se rechaza Ho:
d = 0 con un nivel de significancia de 0.05.. Se concluye que los datos muestrales no proporcioana evidencia
para sustentar la aseveración de que las temperaturas mínimas y pronosticadas para cinco días son diferentes.
Esto no establece que las temperaturas reales y pronosticadas sean iguales.

Prof. Jessica Oliva G. Estadística y probabilidades 17


 PRUEBA DE HIPÓTESIS ACERCA DE LA PROPORCIÓN POBLACIONAL (p)

Las pruebas de hipótesis con proporciones son necesarias en muchas áreas del conocimiento. Se
considerará el problema de probar la hipótesis de que la proporción de éxito en un experimento binomial
sea igual a un cierto valor especifico. Es decir, se probará la hipótesis nula de que p = p0, donde p es el
parámetro de la distribución binomial. La información de que suele disponerse para la estimación de una
x
porción real o verdadera (porcentaje o probabilidad) es una proporción muestral , donde x es el número
n
de veces que ha ocurrido un evento en n ensayos. Por ejemplo, si una muestra aleatoria de 600 compras
x 300
realizadas en una tienda y 300 se realizan con tarjeta de crédito, entonces   0.50 se puede
n 600
utilizar esa cifra como estimación de punto de la proporción real de compras realizadas en ese negocio que
se abonaron a tarjetas de crédito. De la misma forma muchas compañías podrían estimar las proporciones
de muchas transacciones. La hipótesis alterna puede ser una de las alternativas usuales unilateral o bilateral
tales como: p  p0 , p  p0 ,..o.. p  p0 .

CUADRO RESUMEN

Reglas de decisión (o regiones óptimas) para docimar


Tipos de prueba Hipótesis alternante Se rechaza Ho, si
Cola izquierda H1 : p < po Zc < -Z1-
Cola derecha H1 : p > po Zc > Z1-
Dos colas H1 : p  po |Zc| > Z1-/2
p  p0 p  p0
Estadísticas: Zc  ó Zc 
p o (1  p o ) po (1  po )  N  n 
 
n n  N 1 
Cuando se conoce el tamaño de la población

EJEMPLO: Un fabricante de semiconductores produce controladores que se emplean en el sistema


eléctrico de vehículos. El cliente requiere que la proporción de controladores defectuosos no sea mayor
de 0.05, y que el fabricante demuestre estas características del proceso de fabricación con este nivel de
calidad, con un nivel de significancia del 5 %. El fabricante de semiconductores toma una muestra aleatoria
de 200 dispositivos y encuentra que 4 de ellos son defectuosos. ¿El fabricante puede demostrar al cliente
la calidad exigida? Saque sus conclusiones.

Para resolver el problema hay que plantear una hipótesis alternativa unilateral de una cola por la izquierda

es decir, p< 0.05 y para ello se busca en la tabla el valor de


Z1 ,..que..es..Z1  1,645.

Datos:
p0  0.05, q  0.95, p  4 200  0.02, n  200.

Prof. Jessica Oliva G. Estadística y probabilidades 18


Hipótesis:
H 0 : p  0.05
H1 : p  0.05

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si: Z c  1,645

Aplicando fórmula se tiene:


p  p0 0.02  0.05
Zc    Z c  1.95
p 0 (1  p 0 ) 0.05 x0.95
n 200

Conclusión: Como Z c  1.95  1,645 , se rechaza H 0 : p  0.05 con un nivel de significancia de


0.05. Se concluye que la proporción de artículos defectuosos es menor del 5 %, como quería el cliente.

 INTERVALO DE CONFIANZA PARA UNA PROPORCION

El estimador puntual de p es la estadística proporción de éxitos en la muestra definida por:


x
p ; Donde x es el número de éxitos en la muestra.
n

CASO: Si p es la proporción de éxitos en una muestra aleatoria de tamaño n, entonces, el intervalo de


confianza (1 - ) x100% para p es:

p(1  p) p(1  p)
[ p  z1 / 2  p  p  z1 / 2 ]
n n

p(1  p)
Error estándar de p (E.S):  p 
n

p(1  p)
Error máximo de estimación de p: e  z1 / 2
n

Prof. Jessica Oliva G. Estadística y probabilidades 19


 PRUEBA DE HIPÓTESIS ACERCA DE LA DIFERENCIA ENTRE PROPOCIONES (p1-p2)

Reglas de decisión (o regiones óptimas) para docimar


Ho: p1 – p2 = 0. Para un nivel de significancia 
Tipos de prueba Hipótesis alternante Se rechaza Ho, si
Cola izquierda H1 : p1 < p2 Zc < -Z1-
Cola derecha H1 : p1 > p2 Zc > Z1-
Dos colas H1 : p1  p2 |Zc| > Z1-/2
p1  p 2 x1 x2
Estadísticas: Zc  p1  , p2 
1 1 n1 n2
p(1  p)  
 n1 n2 

x1  x2 n1 p1  n2 p 2
p  ó p 
n1  n2 n1  n2

EJEMPLO: En un proceso de producción de botellas de vidrio se tomó una muestra de 400 de las cuales 28
estaban defectuosas, en otro proceso se tomaron 300 muestra de botellas de la cuales 15 estaban defectuosas.
Demuestre la hipótesis nula p1  p 2 de que los dos procesos generan proporciones iguales de unidades
defectuosas, contra la hipótesis alternativa p1  p 2 con un nivel de significancia de 0.05.

Pr oporcion..1.......... .......... .......... .......... . Pr oporcion..2


n1  400.......... .......... .......... .......... ..........n2  300
28 15
p1   0.07.......... .......... .......... ....... p2   0.05
400 300
x1  28.......... .......... .......... .......... .......... ..x2  15
28  15 43
p   0.061,......q  1  p  0.939
400  300 700
El..valor..de..Z1 2 ..al..0.05... para..una..hipotesis..alternativa..bilateral..es..Z1 2  1.96

Para resolver este problema se plantearán las hipótesis y luego se aplica la formula.

Hipótesis:
H 0 : p1  p2
H1 : p1  p2

Regla de decisión o Región crítica: Se rechaza la Hipótesis nula si Zc >1 .96

Aplicando fórmula se tiene:

Prof. Jessica Oliva G. Estadística y probabilidades 20


p1  p2 0.07  0.05
Zc    Z c  1.09
1 1   1 1 
pq   (0.061)(0.939)  
 n1 n2   400 300

Conclusión: Como Zc = 1.09 < 1.96, no se rechaza H 0 : p1  p2 con un nivel de significancia de 0.05. Por
lo tanto, no se puede concluir que existan diferencias reales entre las dos proporciones verdaderas de unidades
defectuosas.

 INTERVALO DE CONFIANZA PARA LA DIFERENCIA ENTRE DOS PROPORCIONES


Si p1 y p2 son las proporciones de éxitos en dos muestras aleatorias independientes n1 y n2 respectivamente,
entonces, el intervalo de confianza del (1 - ) x100% del parámetro p1 - p2 es

[( p1  p 2 )  z1 / 2 P1 P2  p1  p2  ( p1  p 2 )  z1 / 2 P1 P2 ]

p 1 (1  p 1 ) p 2 (1  p 2 )
Error estándar de la estadística (p1 – p2) (E.S):  P1  P 2  
n1 n2

Prof. Jessica Oliva G. Estadística y probabilidades 21

Вам также может понравиться