Вы находитесь на странице: 1из 20

CÁTEDRA

PROBABILIDAD Y ESTADÍSTICA
Depto. Ms. Básicas

ESPECIALIDADES

Ingeniería Eléctrica
Ingeniería Mecánica
Ingeniería Metalúrgica

DOCENTES

Prof. Adjunto: Dra. Ana María Craveri


Ayudante de Primera: Est. Susana Carasai

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 1


CAPÍTULO 8
PRUEBAS O ENSAYOS DE HIPÓTESIS

8.1 Introducción a La Prueba de Hipótesis


Hemos dicho al iniciar el capítulo de estimación de parámetros que el propósito de gran
parte de las investigaciones estadística es poder generalizar conclusiones, a partir de la
información contenida en muestras aleatorias, acerca de las poblaciones de las cuales se
obtuvieron esas muestras. Precisamente en ese capítulo se analizó el procedimiento de
estimar, en base a una muestra aleatoria, el valor de un parámetro de la población mediante
un intervalo de valores reales que cubre, con una cierta probabilidad, el verdadero valor
paramétrico.
Hay muchos problemas en los que, más que estimar el valor de un parámetro, debemos
decidir, a partir de la información de la muestra, si un supuesto acerca de la población es
cierto o no. Este procedimiento de inferencia estadística se conoce como prueba (test) o
ensayo de hipótesis.
Por ejemplo:
• Se sabe que la distancia media de frenado es de 16,5 m. Se ensaya un nuevo sistema
de frenos, más costoso, que se supone disminuye significativamente la distancia
promedio de frenado ¿Cómo tomar la decisión de cambiar o no el sistema de
frenos?
• El agente de compras de una empresa ha establecido como norma para aceptar lotes
de cierta pieza que si el diámetro promedio del lote es de 15,0 mm. el lote es
aceptado. Una muestra de 10 piezas de un lote da una media de 15,6mm ¿debe ser
aceptado o rechazado el lote?
• En cierto tipo de soldadura se acepta un 2% de defectuosas. Se prueba un nuevo
soldador y sobre 117 soldaduras resultan 3 defectuosas ¿Qué puede decirse sobre la
eficiencia del nuevo soldador?
• Se quiere comparar la proporción de defectuosos en lotes de piezas producidos con
dos aleaciones distintas (la tradicional y una nueva aleación más económica). De
1000 pieza producidas con la aleación actual 94 resultaron defectuosas y de 200
producidas con la nueva aleación 12 fueron defectuosas. ¿A qué conclusión
arribaríamos?

En estas situaciones se plantea la elección de uno de dos cursos de acción:


• a0: seguir con el sistema de frenos tradicional que tiene una distancia media de
frenado de 16,5 m.
a1: cambiar por el nuevo sistema que se supone tiene un promedio de distancia de
frenado inferior a 16,5 m.
• a0: aceptar el lote porque el diámetro promedio de las piezas es de 15 mm.
a1: rechazar el lote porque el diámetro promedio de las piezas es distinto de
15 mm
• a0: contratar al soldador porque la proporción de soldaduras defectuosas se
mantiene en el valor estándar
a1: no contratar al soldador porque la proporción de soldaduras defectuosas aumentó

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 2


• a0: usar la nueva aleación porque la proporción de piezas defectuosas es la misma
para ambos procesos
a1: continuar con la aleación tradicional porque la proporción de piezas defectuosas
es distinta para ambos procesos.

La elección entre a0 y a1 deberá hacerse en base a la información incompleta aportada por la


muestra.
Así por ejemplo nos planteamos ¿por qué la evaluación de las distancias de frenado de una
muestra no siempre conduce a conclusiones correctas sobre el sistema de frenos a utilizar?
La respuesta es que los valores de distancia observados dependerán, por ejemplo, de los
vehículos que se consideraron en la muestra; dado que estos valores pueden variar de una
muestra a otra, es posible que ciertas muestras produzcan valores engañosos y por ende
decisiones incorrectas. La posibilidad de decidir continuar con el sistema de frenos
tradicional cuando debería cambiarse por el nuevo, o de cambiar por el nuevo, más costoso,
cuando en realidad produce el mismo efecto que el anterior son errores imposibles de
eliminar.
De lo expuesto se desprenden dos conceptos fundamentales en el desarrollo de este
capítulo: el concepto de ‘hipótesis estadística’ y el concepto de ‘errores’ en la toma de
decisiones a partir de información incompleta.

8.2 Hipótesis estadística. Errores y riesgos de la prueba.


8.2.1 Planteo de Hipótesis
En un sentido amplio una hipótesis es cierto supuesto cuyo valor de verdad se desconoce.
Más específicamente, una hipótesis estadística es un supuesto sobre la distribución de
probabilidad de una variable aleatoria. Podemos enunciar una hipótesis dando el tipo de
distribución y el valor del parámetro o de los parámetros que la definen. Por ejemplo:
• La distancia promedio de frenado es normal con µ = 16,5 m
• El número de soldaduras defectuosas es una binomial con p = 0.02
En la práctica, la distribución de la población es a menudo implícitamente supuesta,
especificándose la hipótesis solamente en términos del parámetro.
Formalizando conceptos podemos decir que se denomina ensayo o prueba (test) de
hipótesis al procedimiento que se sigue para decidir si una hipótesis es verdadera o falsa. Se
denomina hipótesis nula a la hipótesis objeto del ensayo y se la simboliza H0. La Hipótesis
nula (H0) es la única que se prueba, es rechazada cuando los datos muestrales bajo la regla
de decisión construida son demasiado poco probables bajo el modelo poblacional supuesto
en la H0.
La prueba de hipótesis puede llevarnos a concluir que la hipótesis nula es falsa cuando en
realidad es verdadera, o a la conclusión de que no hay suficiente evidencia en la muestra
como para rechazar lo afirmado por ésta cuando en realidad es falso.
Cuando se concluye que la hipótesis nula es falsa se dice que se rechaza la hipótesis nula,
esto nos lleva automáticamente a aceptar lo que llamamos la hipótesis alternativa que
simbolizamos H1.
De modo tal que el primer paso de una prueba de hipótesis consiste en plantear, por
ejemplo, alguno de los siguientes pares de hipótesis sobre un parámetro cualquiera θ:

Ho) θ = θo H1) θ ≠ θo

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 3


Ho) θ ≥ θo H1) θ < θo
Ho) θ ≤ θo H1) θ > θo
El planteo de las hipótesis está relacionado con los riesgos de la prueba que se tratan
seguidamente, pero en este momento podemos enunciar la siguiente pauta para la
formulación de las hipótesis:

Cuando el objetivo de un experimento es establecer una afirmación, la negación de la


afirmación debe considerarse como la hipótesis nula en tanto que la afirmación del
investigador se consigna en la hipótesis alternativa

8.2.2 Error de tipo I y error de tipo II. Riesgos de la prueba.


Si se toma la decisión de aceptar la hipótesis nula y ésta es cierta, la decisión tomada es la
correcta. Lo mismo sucede si se rechaza Ho cuando en realidad es falsa.
Sin embargo cuando se rechaza la hipótesis nula y es verdadera, se está cometiendo un
error que se denomina de Tipo I (e1) cuya probabilidad es: P(eI) = α. A esta probabilidad se
la denomina nivel de significación y se define como el riesgo de rechazar la Ho siendo
cierta, es decir rechazarla cuando debería ser aceptada.
De la misma manera, si la decisión es no rechazar Ho siendo falsa, el error que se comete es
de Tipo II (eII) y su probabilidad se simboliza: P(eII) = β, a esta probabilidad se la define
como el riesgo de no rechazar Ho cuando es falsa.
Resumiendo:

Decisión Ho) cierta Ho) falsa


Aceptar Correcta eII
Rechazar eI Correcta

A continuación simbolizaremos las siguientes probabilidades condicionadas


P(aceptar H0/cierta H0) = 1 - α
P(aceptar H0/falsa H0) = β
P(rechazar H0/cierta H0) = α
P(rechazar H0/falsa H0) = 1 - β

La P(eI) que simbolizamos con α y la P(eII) que simbolizamos con β son los riesgos
asociados con la prueba. Para un tamaño de muestra determinado si se disminuye uno
aumenta el otro, para reducir ambos simultáneamente se debe aumentar el tamaño de la
muestra.

8.3 Nivel de significación α (riesgo α)


Si bien no podemos eliminar la posibilidad de cometer los errores de tipo I y II, podemos
controlar, de alguna manera, las probabilidades de cometer esos errores.
El planteo de las hipótesis y la determinación de los valores de α y β están íntimamente
relacionados. Una vez formulada la hipótesis nula (H0) y la hipótesis alternativa (H1) el
paso siguiente es la determinación del nivel de significación (α) o sea el riesgo de
rechazar la hipótesis nula siendo cierta, es decir el riesgo de cometer un error de tipo I.

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 4


Según lo desarrollado en el punto 8.2.1, a menudo formulamos hipótesis para probar un
valor único para un parámetro. Esto implica, por lo general, que como hipótesis nula
planteemos lo contrario de lo que esperamos demostrar. Por ejemplo, si nos remitimos al
ejemplo sobre los sistemas de frenos (presentado 8.1) si estamos ensayando una nuevo
sistema de frenos plantearíamos como hipótesis nula que el nuevo sistema produce el
mismo efecto que el sistema habitual, es decir, en términos del parámetro media
poblacional plantearíamos:

H0) µ≥µ0 = 16,5 m H1) µ< µ0

Seguidamente asignamos un valor a la probabilidad de rechazar la H0 siendo cierta (riesgo


α) es decir cuantificamos la probabilidad de cometer un error de tipo I asignando un valor
al nivel de significación α, generalmente α =0.05 ó α =0.01. Esto significa que estamos
admitiendo que 5 (ó 1) de cada 100 muestras de tamaño n estarían llevándonos a una
decisión equivocada, en este caso cambiar el sistema habitual por uno más costoso cuando
el efecto sobre la distancia de frenado es, en promedio, el mismo.
La elección del valor de α, se realiza en base a cuán importante pueden ser las
consecuencias de una decisión de aceptación de H1. Así por ejemplo supongamos que un
laboratorio farmacéutico tiene un medicamento A muy importante en el mercado pero
desea evaluar otro medicamento B, alternativo. Las hipótesis serán:
Ho) seguir fabricando A
H1) fabricar B y dejar de fabricar A
Como el laboratorio desea garantizar al máximo una decisión correcta por H1 (pues ello
implica cambiar la publicidad, el sistema de producción, etc.) la prueba deberá hacerse con
una probabilidad de error de tipo I pequeña (α=0,01 o α=0,001) aún bajo el peligro,
representado por la magnitud de β, de mantener indebidamente la fabricación de A.
Si por el contrario, el medicamento A, lleva poco tiempo comercializándose y el costo de
cambiarlo por B no resulta excesivo, un valor para α=0,05 (5%) o aún del 10% sería
apropiado.
Volviendo a nuestro ejemplo de los sistemas de frenado, dado que la probabilidad de
rechazar equivocadamente la hipótesis nula se tiene bajo control, la hipótesis nula se
conserva a menos que las observaciones la contradigan fuertemente. En consecuencia si el
objetivo del experimento es establecer una nueva afirmación o hipótesis (por ejemplo el
nuevo sistema disminuye la distancia media de frenado) tal suposición debe enunciarse
como hipótesis alternativa H1.
Podemos decir que, así como se asocia el nivel de significación α principalmente con la Ho
el otro riesgo, el β, tiene que ver con la formulación de la hipótesis alternativas.

8.3.1 Riesgo β: Recordemos que β es la probabilidad de no rechazar Ho cuando es falsa y


por lo tanto lo correcto sería rechazarla y aceptar la alternativa; a diferencia de α que está
prefijado β depende de la diferencia que se establezca entre los valores supuestos del
parámetro y el verdadero valor de éste en la población. Es decir para calcular β debe fijarse
un determinado valor para el parámetro en la H1. Cuanto más se aleja el valor postulado
para el parámetro en H1 del que se ha supuesto en Ho más pequeña será la probabilidad de
cometer este error.
Gráficamente:
Supongamos que θo es el valor del parámetro bajo la Ho y θ1 el postulado en la H1

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 5


Se puede observar que cuanto más corrida a la derecha se ubique la distribución de
probabilidad centrada en θ1 el área punteada que representa la magnitud de β disminuye.
Más adelante se retomará el concepto de β cuando se mencione la idea de potencia de la
prueba; el análisis del comportamiento de β para n y α fijos tiene una aplicación importante
en la construcción de la Función de Potencia y la Función característica de operación (curva
OC).
Además, al final del capítulo, se tratará una aplicación importante de α y β en la
determinación del tamaño de muestra n para niveles predeterminados de estos riesgos.

8.4 Determinación del estadístico de prueba


Puesto que la decisión entre Ho y H1 ha de hacerse basándose en pruebas de muestras, es
necesario escoger una función de las n observaciones de la muestra como estadística de
prueba. Generalmente resulta ser el estimador convencional del parámetro previsto en Ho y
cuya distribución en el muestreo es conocida.
De esta manera, una vez que se han formulado las hipótesis y fijado el nivel de
significación, el tercer paso del procedimiento es considerar la distribución en el muestreo
del estadístico que estima al parámetro que se está testando.
El rechazo o aceptación de Ho depende de la magnitud del estadístico de prueba. Un
ejemplo de estadístico de prueba es:

x−µ
Z= = zobs
σ
n

Esta variable z tendrá una distribución Normal de parámetros µ = 0 y σ = 1 si la hipótesis


nula es cierta (es decir bajo la hipótesis nula). La magnitud del estadístico de prueba, en
este caso se ha simbolizado con z ó zobs
En este momento nos referiremos a un parámetro cualquiera θ, más adelante se
desarrollarán los estadísticos de prueba específicos para los parámetros µ y p y en capítulos
posteriores para el parámetro σ2.

8.5 Regla de decisión


El paso siguiente es plantear la regla de decisión. Hay tres tipos de pruebas, según sea la
forma en que se formulan Ho y H1

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 6


1) Ho) θ = θo H1) θ≠θo

2) Ho) θ ≤ θo H1) θ < θo

3) Ho) θ ≥ θo H1) θ > θo

Para decidir sobre la hipótesis nula se debe determinar lo que denominamos el “valor
crítico” (θc), este valor divide la distribución en dos zonas o regiones, una de ellas se
denomina zona o región de no rechazo (o aceptación: ZA) de la hipótesis nula y la otra es la
zona de rechazo (Zr) de la hipótesis nula.

El valor que separa ambas zonas (valor crítico) depende de:


- la hipótesis alternativa
- el nivel de significación
- la distribución de probabilidad del estadístico de prueba

Para las hipótesis planeadas en el punto 8.5 las regiones serían las siguientes:

-θc θc -θc θc
Figura Nº 1 Figura Nº 2 Figura Nº 3

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 7


Para el caso de una prueba bilateral (Figura Nº 1) si el estadístico de prueba calculado con
la muestra que simbolizaremos θobs pertenece al intervalo (-θc; θc) no se rechaza la Ho, si
por el contrario θobs < -θc ó θobs > θc se rechaza Ho. Un criterio análogo se sigue para las
pruebas unilaterales (Figuras Nº 2 y 3).
Cuando la prueba no rechaza Ho diremos que en la muestra no hay suficiente evidencia en
contra de la hipótesis nula, esto no debe ser tomado como que la hipótesis nula es
verdadera. La conclusión fuerte de la prueba de hipótesis se obtiene en el rechazo de la
hipótesis nula, en este caso se suele decir, además, que el resultado es estadísticamente
significativo, de lo contrario se dice que no es significativo, en cualquier caso se debe a
continuación especificar el nivel de α al cual resulta significativo (o no).

8.6 Potencia de la prueba. Recordemos que la probabilidad de rechazar la hipótesis nula


siendo cierta es α (P(eI) = α.) y la probabilidad de aceptarla siendo falsa es β (P(eII) = β).
Veamos ahora las probabilidades de los dos tipos de errores gráficamente. Supongamos que
se plantean las siguientes hipótesis:
Ho) θ = θo H1) θ ≠ θo

Las zonas rayadas corresponden a P(eI), o sea a la probabilidad de rechazar la hipótesis nula
siendo cierta, las zonas punteadas corresponden a P( eII) que es la probabilidad de aceptarla
siendo falsa.
Para analizarlo más sencillamente pensemos en una prueba unilateral
H0) θ ≤θo H1) θ > θo

Notemos que si θ es el estimador insesgado de θ , entonces si H0 es cierta la probabilidad


de observar un valor de θ menor o igual al θc es igual a 1 – α y se expresa como P
( θ ≤θc) = 1 – α
Evidentemente si queremos calcular el área punteada β debemos fijar un valor θ1 mayor que
θo y calcular así P( θ ≤θc) pero suponiendo ahora que E( θ ) = θ1
Si nos concentramos ahora en la distribución con θ = θ1

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 8


Podemos ver claramente que P( θ >θc) = 1 – β. Por esta razón a esta probabilidad se la
denomina potencia de la prueba, porque es la capacidad de la prueba de aceptar la hipótesis
alternativa cuando es cierta.

8.7 Pruebas de hipótesis sobre la media de una población (µ)


La media de una población es un parámetro muy importante y con frecuencia se desea
saber si su valor ha cambiado o no. En este tipo de problemas se trabaja con una sola
muestra y se pueden presentar los siguientes casos:

8.7.1. Pruebas de hipótesis para la media de una población (µ) con σ conocido

En este caso tenemos n observaciones provenientes de una población de la cual conocemos


σ por experiencias anteriores. Se podrán formular entonces las siguientes hipótesis:

Ho) µ= µ o H1) µ ≠ µ o
Ho) µ ≤ µ o H1) µ > µ o
Ho) µ ≥ µ o H1) µ < µ o

El estadístico de prueba será:


x−µ
Z=
σ
n
Que tendrá una distribución normal estandarizada con parámetros µ = 0 y σ = 1 bajo la
hipótesis nula.

Ejemplo Nº 1
La especificación de un medicamento de fuerte acción tóxica que se presenta bajo la forma
de comprimidos es: peso promedio µ=5mg. y σ=1mg. Se ha considerado una muestra de
tamaño 50 comprimidos de una partida del medicamento y se ha calculado un peso
promedio en la muestra de 5,18mg. ¿Hay evidencia en la muestra para afirmar que esta
partida tiene comprimidos con un peso promedio distinto de 5 mg? Se está dispuesto a
correr un riesgo de 1% de retirar la partida del mercado cuando, en realidad, cumple con la
especificación.

Planteo de hipótesis
Ho) µ = 5mg H1) µ ≠ 5mg

Nivel de significación: α = 0.01

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 9


Estadístico de prueba
5,18 − 5
Z= = 1,27 = zobs
1
50

Regla de decisión

-zc=-2.576 zc=2.576
µ<5 µ=5 µ>5

Decisión:
Puesto que zobs = 1,27 pertenece al intervalo (-2,576;2,576) la decisión es no rechazar Ho
Conclusión: no hay evidencia en la muestra de que los comprimidos de esta partida tengan
un peso promedio distinto de 5mg.

Ejemplo Nº 2
Retomemos el enunciado del ejemplo Nº 1. Dado que resultaría muy grave enviar al
mercado una partida de comprimidos con un peso promedio superior a 5mg, el investigador
realiza una prueba planteando las siguientes hipótesis:

1) Ho) µ ≤ µ o = 5mg H1) µ > 5mg

2) Nivel de significación: α = 0.01

3) Estadístico de prueba
5,18 − 5
Z= = 1,27
1
50

4) Regla de decisión

µ= 0 zc = 2,326

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 10


Nuevamente la decisión es no rechazar Ho, con lo cual se concluye que el peso promedio
de los comprimidos es a lo sumo 5mg.

¿Cuál es el promedio de peso de la muestra a partir del cual se rechazaría la hipótesis nula?

Siendo
x −5
2,326 =
1
50

Despejando de esta ecuación x


1
x = 2,326. + 5 = 5,323
50

µ= 5 xc = 5,323

Se concluye que rechazaríamos que el promedio de peso de los comprimidos es a lo sumo


5mg toda vez que el promedio de la muestra sea superior a 5,323 mg

Ejemplo Nº 3
Siguiendo con el enunciado del ejemplo Nº 1, supongamos ahora que resultaría muy grave
que el peso promedio de los comprimidos sea 5,4 mg. Si este supuesto es cierto ¿qué riesgo
se estaría corriendo de aceptar la hipótesis nula siendo falsa?

En este caso el problema que se plantea es el de calcular la probabilidad de cometer un


error de tipo II, es decir para responder al problema debemos calcular β, suponiendo que el
promedio de peso del comprimido es µ1 = 5,4 mg

5,323 − 5,4
P( z < ) = P( z<-0.54)= 0.2946
1
50

La probabilidad de aceptar que el promedio de peso del comprimido es a lo sumo 5 mg


cuando en realidad es de 5,4 mg es 0.2946. Se observa que esta probabilidad decrece al
alejarse el supuesto valor medio µ1 del valor postulado µ0

8.7.2. Pruebas de hipótesis sobre la media poblacional (µ) con σ desconocido


En ocasiones el valor de σ es desconocido y debe ser estimado mediante S (desvío estándar
muestral) con los datos de la muestra.
Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 11
En este caso, como ya se ha planteado en el capítulo de distribuciones en el muestreo, la
distribución del estadístico de prueba:
x−µ
t= es una distribución t de Student con v= n-1 grados de libertad si H0 es cierta.
S
n

Para el caso en que el tamaño de muestra n es grande (n>30) la distribución t de Student se


aproxima a la distribución de probabilidad normal de parámetros µ y σ y en ese caso el
estadístico t planteado se distribuye aproximadamente N(0;1).

Ejemplo Nº 4
Una empresa automotriz afirma que una de las características que diferencian sus
productos de los de la competencia es la seguridad. Para verificar su sistema de frenos se
realiza el siguiente ensayo: con el vehículo a 60km/h se clavan los frenos y se mide la
distancia hasta que el vehículo se detiene. Las pautas del mercado automotriz para la
variable X: distancia de frenado es una distribución normal con µ=16.5m.
Un nuevo sistema pretende disminuir la distancia media de frenado, este sistema es probado
en 16 vehículos homogéneos y se obtiene un promedio en la muestra de 16.185m con un
S=0.69 m.
a) Decida si puede suponerse que la distancia media de frenado se ha reducido
significativamente (α=0.10)
b) Analice si el nivel de significación α=0.10 adoptado puede considerarse adecuado
para la decisión que se desea tomar. Para fundamentar el análisis debe considerar
cuál de los dos tipos de errores es más preocupante.

Ho) µ ≥ 16.5 m H1) µ < 16,5 m

α = 0.10

16,185 − 16,5
t = = - 1.83 = tobs
0,69
16
Según lo visto en distribuciones en el muestreo este estadístico tiene una distribución t de
Student con v= 15 grados de libertad

t=-1,3406 0

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 12


La decisión es rechazar la hipótesis nula (Ho) y concluir que la población de donde se
extrajo esta muestra tiene una distancia de frenado promedio inferior a 16,5 m. El valor
crítico de x = 16.27 m. Podría aportarse un intervalo de confianza para el nuevo parámetro
a partir de su estimador x = 16,185m.
Resultando:
15,88 m<µ1<16,49 m
Diríamos que la verdadera distancia de frenado con este nuevo sistema está entre 15,88m y
16,49 m con un 90% de confianza.

b) Supongamos que el departamento de diseño sostiene que la distancia media de frenado


de este nuevo sistema es 16 m ¿Qué probabilidad hay de no implementarlo siendo cierto?
16,27 − 16
P(t > = 1.57 ) = 0.069. Utilizando la función t de Student del paquete de
0,69
16
funciones de EXCEL se puede calcular esta probabilidad.

La probabilidad de no implementar el nuevo sistema siendo que realmente reduce la


distancia media de frenado a 16 m es menor a 7 %, en tanto que la probabilidad de
implementarlo siendo que en realidad no disminuye la distancia media de frenado (que
seguiría siendo de 16,5 m) es del 10%, sin duda uno de los elementos de más peso en la
determinación de estos niveles de riesgo es el costo de implementar el nuevo sistema y las
consecuencias civiles que puede acarrear asegurar una disminución en la distancia media de
frenado que es falsa. En el punto 8.11 se proporciona una forma de determinar el tamaño de
la muestra en función de valores predeterminados de α y β.

Nota: Queda para el lector evaluar la posibilidad de fijar un nivel de significación de 0.05.

8.8 Procedimiento de toma de decisión basada en el valor p (p value)

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 13


Este procedimiento es muy común cuando se trabaja con un software estadístico. El valor p
(p value) es la probabilidad de obtener un valor de la estadística de prueba igual o más
extremo que el resultado obtenido a partir de los datos de la muestra siendo la hipótesis
nula (Ho) verdadera. Los paquetes estadísticos disponibles proporcionan información sobre
el ‘nivel de significación observado’ es decir el valor p observado con la muestra.
La regla de decisión en este caso es:

• Si el valor p es mayor o igual a α, la hipótesis nula no es rechazada


• Si el valor p es menor que α, la hipótesis nula es rechazada

En el ejemplo Nº4 el estadístico de prueba es t=-2.54, utilizando la Distribución t de


Student del paquete de funciones estadísticas de EXCEL resulta:
P(t<-2.54/Ho cierta)=0.011 menor al nivel de significación α=0.10 por lo que se rechaza
Ho)

8.9.- Curva de Potencia y Curva Característica de Operación (Curva Operativa)

Ejemplo Nº 5
Se extraen periódicamente muestras de tamaño 15 para controlar la resistencia a la rotura de
piezas de Dural. La resistencia media debe ser de 38 Kg/mm2. El criterio es: si la resistencia
media es menor de 38 Kg/mm2, detener el proceso productivo con probabilidad 0,1. Se sabe
que la variable tiene un desvío estándar σ = 1,3 Kg/mm2
a) ¿A partir de qué valor de x se detendría el proceso?
b) Calcular la probabilidad de detectar que la resistencia media vale 37,5 Kg/mm2
c) Dibujar la curva operativa y la curva de potencia del ensayo.

Solución:

a) Ho) µ ≥ µ 0 = 38 H1 ) = µ < µ0
Siendo α = 0,1 que es la probabilidad de detener el proceso cuando trabaja con una
media de 38 Kg/mm2, La regla de decisión es detenerlo toda vez que se observe:
1,3
xc = 38 − 1,286 = 37,57
15

b) La probabilidad de detectar que la resistencia media vale 37,5Kg/mm2 es la probabilidad


de rechazar la hipótesis nula cuando es falsa y el verdadero promedio es
µ1 = 37,5 , es decir, la potencia del ensayo, luego
 (37,57 − 37,5) 15 
P  z < = 0,21 = 0,583 =1-β
 1,3 
c) A partir de esta última expresión podemos calcular una tabla de valores de la potencia (1-
β) y de β para distintos valores de la hipótesis alternativa µ1

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 14


µ1 1-β β
37 0,95 0,05
37,2 0,865 0,135
37,4 0,694 0,306
37,6 0,464 0,536
37,8 0,246 0,754
38 0,1 0,9
38,2 0,03 0,97

8.10.- Test de Hipótesis para el parámetro proporción


Hay situaciones en las que, en el muestreo, la característica observada es de naturaleza
cualitativa y habitualmente puede ser clasificada en dos categorías mutuamente excluyentes
por ejemplo: cantidad de piezas defectuosas o no defectuosas en la producción diaria de una
máquina. En estos casos en que analizamos datos cualitativos, nos interesa probar supuestos
acerca de la proporción de éxitos en la población de donde ha sido extraída la muestra o sea
plantear hipótesis sobre el ‘parámetro proporción’ p.
En el desarrollo de las pruebas de hipótesis para la proporción, se utiliza la misma
metodología que para las pruebas de hipótesis para la media poblacional. Las hipótesis que
pueden plantearse son:

Ho) p= p o H1 ) p ≠ p o
Ho) p ≤ p o H1 ) p > p o
Ho) p ≥ p o H1 ) p < p o

El estadístico de prueba utilizado es

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 15


p − p0
z= con distribución N (0;1) si se cumple la hipótesis nula
p 0 q0
n

Ejemplo Nº 5
Se asegura que el porcentaje de votos favorables a cierto candidato es 53%. En una
determinada localidad se consultan 474 votantes de los cuales 243 se manifiestan
favorables a este candidato. ¿Qué puede decirse sobre la proporción de votos favorables a
este candidato? (α = 0.05)

Si se está evaluando la intención de votos para cierto candidato, podemos pensar en una
prueba bilateral y decidir si la proporción de votos se mantiene en el nivel asegurado (53%)
o si cambió.

Ho) p = po = 0,53 H1) p ≠ po α = 0.05

243
La proporción de votos favorables estimada en la muestra es: p = = 0,51
474

El estadístico de prueba es:

0.51 − 0.53
Z= = - 0.87
0.53 × 0.47
474

Regla de decisión

-1.96 0 1.96

La decisión es no rechazar la hipótesis nula y concluir que la proporción de votos


favorables se mantiene en 53%.

Si procedemos a tomar la decisión a través del valor p, calculamos la probabilidad normal


de observar un valor del estadístico de prueba igual o más extremo que 0,87. Luego:

P(z>0.87) + P(z<-0.87) = 2 x 0,1922 = 0,3844

Como 0.3844 > 0.05 no se rechaza Ho.

8.11.- Determinación del tamaño de muestra basándose en α y β.

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 16


Vimos que en el Procedimiento de la Prueba de Hipótesis se fija solamente el valor para α
sin la evaluación explícita de β. Lo ideal sería asignar valores específicos a ambos riesgos
en una determinada prueba y determinar el tamaño de la muestra que pueda satisfacer
ambas especificaciones.
Suponiendo que se plantea una prueba de una cola se puede determinar el tamaño de la
muestra utilizando la siguiente expresión:

σ x2 (z1−α + z1− β )2
n=
(µ 0 − µ 1 ) 2

En la que σ x2 = variancia de la población


zα = valor de z para un nivel de significación, α dado
z β = valor z para un valor β dado
µ 0 = valor de la media poblacional bajo la hipótesis nula
µ1 = valor de la media poblacional bajo la hipótesis alternativa

Ejemplo Nº 6
Retomamos el problema del ejemplo Nº 5 y planteamos lo siguiente: se desea establecer un
sistema de muestreo periódico para controlar la resistencia a la rotura de piezas de Dural, de
modo tal que se cumplan las siguientes condiciones:
• Si la resistencia media es de 38 Kg/mm2, detener el proceso productivo con
probabilidad 0,1
• Si dicho parámetro vale 37Kg/mm2, detener el proceso con probabilidad 0,95.
Se sabe que la variable tiene un desvío estándar σ = 1,3 Kg/mm2. Indicar las hipótesis, la
regla de decisión y el tamaño de muestra a tomar

Solución:

a) Ho) µ ≥ µ 0 = 38 H1 ) = µ < µ0
Siendo α = 0,1 que es la probabilidad de detener el proceso cuando trabaja con una
media de 38 Kg/mm2, La regla de decisión es detenerlo toda vez que se observe:
1,3
x ≤ 38 − 1,286 ×
n
Dado que el criterio establece detener el proceso cuando H1 es cierta con
probabilidad 0,95, resulta:
1-β = 0,95 ⇒ β = 0,05 ⇒ z1− β = 1,64

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 17


2
 1,3(1,286 + 1,64) 
n=  = 14,47
 38 − 37 

n=15
1,3
luego, el valor de xc = 38 − 1,286 = 37,57 Kg/mm2
15

Deberá tomarse entonces una muestra de n=15 piezas, ensayarlas hasta la rotura,
calculando su promedio x y deteniendo el proceso productivo si este valor resulta inferior a
37,57 Kg/mm2

8.12.- Comentarios finales sobre los riesgos de la prueba.

Vimos que los riesgos α y β son probabilidades condicionadas que están estrechamente
relacionadas. En particular, cuando el tamaño de la muestra es fijo, varían inversamente al
variar el “valor crítico”.
En cuanto a si el riesgo α debe ser 0,05 ó 0,01, o algún otro valor, diremos que no hay una
regla fija, podríamos decir que si se tiene un alto grado de creencia en la veracidad de la
Hipótesis Nula debe asignarse una pequeña probabilidad de rechazarla cuando es realmente
cierta, es decir debe fijarse un α en 0,01 o tal vez más pequeño. De este modo Ho se
mantendrá a menos que haya fuerte evidencia en la muestra de su falsedad. El peligro de
seguir este criterio es que eventualmente una Hipótesis Nula no sería nunca rechazada,
cualquiera que sea la evidencia de la muestra, con sólo tomar un valor para α muy cercano
a cero. Por otra parte, si se cree muy firmemente en la Hipótesis Alternativa debe fijarse un
valor para α de 0,05 o superior. Pensamos que un criterio a seguir podría ser el siguiente:
“Si rechazar la Hipótesis Nula sería costoso o grave, el riesgo α debe ser pequeño; cuando
una aceptación errónea de la Hipótesis Nula es costoso o grave, el riesgo β debe ser
pequeño (o el α debe ser alto)”

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 18


8.13.- Ejercicios

1.- Se está controlando un proceso de llenado de cajas de jabón en polvo, la caja debe
contener en promedio 368grs. Con un desvío estándar σ= 15grs. Una muestra aleatoria de
n= 25 cajas arroja una media x = 372.5grs. Decida si es o no necesario alguna corrección
en el proceso completo de llenado de cajas.
Suponga ahora que el encargado de comercialización está preocupado por el hecho de que
las cajas puedan estar siendo llenadas en exceso fundamentan los datos de la muestra esta
sospecha?
Suponga ahora que al inspector de la oficina de Protección al consumidor le interesa ver si
las cajas tienen un contenido inferior a 368grs ¿cuál sería el valor de peso promedio límite
( x c) que debe considerar?
El inspector sospecha que el verdadero peso promedio de las cajas de jabón es de 360grs.
¿cuál es la probabilidad de aceptar la hipótesis de la empresa siendo falsa?
Suponga que el inspector desea tener una probabilidad del 80% (potencia de la prueba) de
rechazar la afirmación de la empresa de que la media es µ=368grs. Cuando en realidad es
de 360grs y está dispuesto a correr un riesgo del 5% de rechazarla siendo cierta. ¿ cuántas
cajas deberá seleccionarse en su muestra?

2.- Una empresa automotriz afirma que una de las características que diferencian sus
productos de los de la competencia es la seguridad. Para verificar su sistema de frenos se
realiza el siguiente ensayo: con el vehículo a 60km/h se clavan los frenos y se mide la
distancia hasta que el vehículo se detiene. Las pautas del mercado automotriz para la
variable X: distancia de frenado es una distribución normal con µ=16.5m.
Un nuevo sistema pretende disminuir la distancia media de frenado, este sistema es probado
en 16 vehículos homogéneos y se obtiene un promedio en la muestra de 16.1856m con un
S=0.8986m.
c) Decida si puede suponerse que la distancia media de frenado se ha reducido
significativamente (α=0.10)
d) Calcule la probabilidad de seguir con el sistema tradicional cuando en realidad el
nuevo sistema reduce la distancia de frenado a 16 m

3.- Algunas plantas de electricidad están situadas cerca de ríos u océanos con el objeto de
que el agua disponible pueda utilizarse para enfriar los condensadores. Suponga que, como
parte de un estudio sobre impacto ambiental, una compañía de electricidad desea estimar la
diferencia en la temperatura media del agua entre la descarga de su planta y las aguas de la
plataforma continental con un 95% de confianza. Se cuenta con los siguientes datos sobre
diferencia de temperatura del agua (en ºC) antes y después de la descarga:
4,0 - 3,5 - 4,8 - 2,0 - 3,8 - 4,5 - 3,9 - 4,2 - 2,6 - 3,9
a) La empresa asegura que la diferencia de temperatura media es a lo sumo 2,5 ºC Si la
Secretaría de Medio Ambiente está dispuesta a correr un riesgo de 0.05 de sancionar
injustamente a la empresa ¿Qué decisión tomaría con los datos de esta muestra?

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 19


b) Cuál debe ser el tamaño de muestra si además se fija el riesgo de no sancionar a la
empresa cuando en realidad la diferencia media de temperatura es µ1= 4ºC en 20%

4.- Un programa nacional de prevención de accidentes obliga a los concesionarios de


autopistas a certificar que están haciendo cumplir el límite máximo de velocidad en sus vías
que es de 120km/h. Se sancionará a aquellos concesionarios si se detecta que más del 60%
de los vehículos que circulan por sus autopistas superan esta velocidad máxima. La oficina
de Control de autopistas detectó, en un mes, en una de las autopistas sobre una muestra de
400 vehículos que 234 superaron la velocidad máxima. Correspondería aplicar alguna
sanción al concesionario de esta autopista. (el nivel de significación es 0.10)

Probabilidad y Estadística – Dra. Ana M. Craveri - Año 2017 Página 20

Вам также может понравиться