Академический Документы
Профессиональный Документы
Культура Документы
ESTADSTICA DESCRIPTIVA
E INFERENCIAL II
COLEGIO DE
BACHILLERES
Colaboradores
Asesora Pedaggica
Olivia Hernndez Romero
Revisin de Contenido
Armando Martnez Cruz
Diseo Editorial
Leonel Bello Cuevas
Javier Daro Cruz Ortiz
NDICE
INTRODUCCIN
PROPSITO
CUESTIONAMIENTO GUA
7
9
11
11
17
19
22
25
1.2 ESTIMACIN
1.2.1 Estimacin Puntual de un Parmetro
26
27
27
27
29
RECAPITULACIN
ACTIVIDADES DE CONSOLIDACIN
AUTOEVALUCIN
BIBLIOGRAFA CONSULTADA
3
35
36
37
38
NTRODUCCIN
PROPSITO
CUESTIONAMIENTO GUA
situacin real. As que la respuesta que puede darse es: La persona tiene una
respuesta; quiz sea correcta. Considera las consecuencias de todos los posibles
errores que se encontrara detrs de una decisin equivocada.
Como te dars cuenta, la prueba de hiptesis, hace referencia a una serie de
cuestionamientos, los cuales conllevan a tomar una decisin. T qu decisin tomaras
si fueras a pintar tu casa?
Quiz no tengas tampoco una decisin firme, pero conforme estudies este fascculo, irs
adquiriendo las herramientas necesarias de conocimientos para llegar a tomar
decisiones claras y precisas.
10
CAPTULO 1
INTRODUCCIN A LA INFERENCIA ESTADSTICA Y
APLICACIONES EN EL CONTROL ESTADSTICO
DE LA CALIDAD
12
13
Hiptesis de investigacin.
Hiptesis nulas.
Hiptesis alternativas.
Hiptesis estadsticas.
Hiptesis Nulas
Constituyen proposiciones acerca de la relacin entre variables, solamente que sirven
para refutar o negar lo que afirma la hiptesis de investigacin. Por ejemplo, si la
hiptesis de investigacin propone: Los adolescentes le atribuyen ms importancia al
atractivo fsico en sus relaciones heterosexuales que las mujeres, la nula postulara:
Los adolescentes NO le atribuyen ms importancia al atractivo fsico en sus relaciones
heterosexuales que las mujeres.
Debido a que este tipo de hiptesis resulta la contrapartida de la hiptesis de
15
Hiptesis Alternativas
Como su nombre lo indica, son posibilidades alternativas ante las hiptesis de
investigacin y nula. Ofrecen otra descripcin o explicacin distinta a la que proporciona
este tipo de hiptesis. Por ejemplo, si la hiptesis de investigacin establece: Esta silla
es roja, la nula afirmar Esta silla no es roja, y podran formularse una o ms hiptesis
alternativas: Esta silla es azul, Esta silla es verde, Esta silla es amarilla, etc. Cada
una constituye una descripcin distinta a las que proporcionan las hiptesis de
investigacin y nula.
Las hiptesis alternativas se simbolizan como Ha y slo pueden formularse cuando
efectivamente hay otras posibilidades adicionales a las hiptesis de investigacin y nula.
De ser as, no pueden existir.
Ejemplos:
Hi: El candidato A obtendr en la eleccin para la presidencia del consejo escolar entre
un 50 y un 60% de la votacin total.
Ho: El candidato A no obtendr en la eleccin para la presidencia del consejo escolar
entre un 50 y 60% de la votacin total.
Ha: El candidato A obtendr en la eleccin para la presidencia del consejo escolar ms
del 60% de la poblacin total.
Si se desea llevar a cabo una prueba estadstica, pero no se sabe cules son las
16
PRUEBAS DE HIPTESIS.
1.1.1 Etapas Bsicas en Pruebas de Hiptesis
En la prueba de hiptesis iniciamos con un valor supuesto (hipottico) de un parmetro
de poblacin. Despus de recoger una muestra aleatoria, comparamos la estadstica de
la muestra, tal como la medida de la muestra (X) con el parmetro hipottico, tal como la
media de la poblacin hipottica (). Luego aceptamos o rechazamos el valor hipottico.
Este valor hipottico se rechaza slo si es claramente improbable que ocurra el resultado
de la muestra cuando la hiptesis es verdadera.
PRIMER PASO.
FORMULAR LA HIPTESIS NULA Y LA HIPTESIS ALTERNATIVA.
La hiptesis nula (Ho) es el valor hipottico del parmetro que se compara con el
resultado de la muestra. Se rechaza solamente si no es probable que ocurra el resultado
de la muestra dada. La hiptesis alternativa (Ha) se acepta si se rechaza la hiptesis
nula. Por ejemplo:
Un auditor quiere probar la suposicin de que el valor medio de todas las cuentas por
cobrar en una firma dada es $260.00 tomando una muestra de n = 36. El auditor desea
17
Decisiones posibles
ESTADOS POSIBLES
Hiptesis nula
Hiptesis nula falsa
verdadera
Correctamente
aceptada
Error de tipo II
Error de tipo I
Correctamente
rechazada
En esta tabla podemos apreciar los tipos de decisiones, y los estados posibles, de
acuerdo al segundo paso de las etapas bsicas.
QUINTO PASO.
DETERMINAR EL VALOR REAL DE LA ESTADSTICA DE PRUEBA.
Por ejemplo, al probar un valor hipottico de la media de la poblacin se toma una
muestra aleatoria y se determina el valor de la media de la muestra. Si el valor crtico se
estableci como un valor Z, entonces la media de la muestra se convierte a un valor Z.
SEXTO PASO.
TOMAR LA DECISIN.
El valor observado de la estadstica de la muestra se compara con el valor o los valores
crticos de la estadstica de la muestra. Entonces, la hiptesis nula se acepta o se
rechaza. Si la hiptesis nula se rechaza, se acepta la hiptesis alternativa. A su vez, esta
decisin ser aplicable a otras decisiones que deban tomar los gerentes de operacin,
por ejemplo, si se mantiene un patrn de operacin, o Cul de dos estrategias de
mercadeo debe emplearse? o Qu factores intervendrn si se hacen cambios en la
produccin? Si sern humanos, o materiales o ambos.
19
Se utiliza una prueba de dos colas cuando estamos interesados en una desviacin
posible en cualquier direccin del valor hipottico de la media. La frmula empleada para
establecer los valores crticos de la media de la muestra es semejante a la frmula para
determinar los lmites de confianza para estimar la media de la poblacin, excepto que el
valor hipottico de la media de la poblacin, o , es el punto de referencia y no la media
de la muestra. Los valores crticos de la media de la muestra para una prueba de dos
colas, segn se conozca no son:
o z x
o z S x
Ejemplo:
Para la hiptesis nula formada en el ejemplo del auditor, el cual quiere probar la
suposicin de que el valor medio de todas las cuentas por cobrar en una firma dada es
de $260.00, tomando una muestra de n = 36, determina los valores crticos de la media
de la muestra para probar la hiptesis a un nivel de significacin del 5 por ciento.
Dado que la desviacin estndar de las cantidades de las cuentas por cobrar es
= $43.00, los valores crticos son:
Hiptesis: Ho: = $260.00 ;
Ha: $260.00
x CR = o z x = 260.00 1.96
n
43
= $ 245.95
= 260.00 + 1.96
36
43
= $ 274.05
= 260.00 1.96
36
Por lo tanto, para rechazar la hiptesis nula media de la muestra se debe tener un valor
que sea menor que $245.95 o mayor que $274.05. De esta manera, existen dos regiones
de rechazo en el caso de una prueba de dos colas.
20
f( x ) Y
Regin de
rechazo
Regin de
rechazo
regin de aceptacin
245.93
260.00
274.05
Los valores z de 1.96 se utilizan para establecer los lmites crticos porque para la
distribucin normal estndar, una porcin de 0.05 del rea corresponde a las dos colas,
lo que corresponde a la especificacin de = 0.05.
En vez de establecer los valores crticos en trminos de la media de la muestra como tal,
los valores crticos en la prueba de hiptesis se especifican tpicamente en trminos de
valores z. Para el nivel de significacin del 5 por ciento, los valores crticos z para una
prueba de dos colas son 1.96 y +1.96, por ejemplo. Cuando se determina el valor de la
media de la muestra, se transforma en valor z para poderlo comparar con los valores
crticos de z. La frmula de transformacin, segn se conozca o no , es:
z=
x o
x
z=
x o
Sx
Una prueba de una cola es apropiada cuando se est interesado en las posibles
desviaciones en una sola direccin desde el valor hipottico de la media. El auditor que
quiere probar la suposicin de que el valor medio de todas las cuentas por cobrar en una
firma dada es $260.00, tomando una muestra de n = 36, puede no estar interesado en
que el promedio verdadero de todas las cuentas por cobrar exceda $260.00, sino en que
pueda ser menor de $260.00, la hiptesis nula y la hiptesis alternativa son:
Ho: $260.00 y Ha: < $260.00
Slo hay una regin de rechazo para una prueba de una cola, la cual est siempre en la
cola que representa el apoyo de la hiptesis alternativa. Como en el caso anterior, para
una prueba de dos colas, el valor crtico puede determinarse para la media como tal o en
trminos de un valor z. Sin embargo, los valores crticos para pruebas de una cola
difieren de los de las pruebas de dos colas porque la porcin de rea dada est toda en
una cola de la distribucin. La siguiente tabla representa los valores de z necesarios para
pruebas de una cola y de dos colas.
21
Una cola
1.65
Dos colas
1.96
1%
2.33
2.58
La frmula general para establecer el valor crtico de la media de la muestra para una
prueba de una cola segn se conozca (alex) o no es:
o + z x
o + z S x
En estas frmulas z, puede ser negativo, dando como resultado una resta del segundo
trmino en cada frmula
22
(1) Formular las hiptesis nula y alternativa para esta situacin de prueba,
(2) Determinar el valor crtico de la media de la muestra que se utilizar al probar la
hiptesis nula a un nivel de significacin del 5%,
(3) Identificar la probabilidad del error de tipo I asociado con el uso del valor crtico
calculado anteriormente como base para la regla de decisin,
(4) Identificar la probabilidad del error de tipo II asociado con la regla de decisin
dado el valor especfico de la media alternativa de $240.00
La solucin completa es:
(1) Ho: 260.00 ;
x o
248.17 240
8.17
=
=
1.14
7.17
x
7.17
regin de rechazo
(error tipo I)
regin de aceptacin
0.05
f( x )
260.00
248.17
rechazo correcto
hiptesis nula
aceptacin incorrecta de la
hiptesis nula (error de tipo II)
0.13
248.17
23
1.00
0.80
0.60
0.40
0.20
50 x 40 x 30 x 20 x 10 x
+10 x
POSICIN POSIBLE
DE LA VERDADERA
24
25
1.2 ESTIMACIN
El segundo tipo de inferencia estadstica es la estimacin. Este procedimiento utiliza
cuando se responde a una pregunta que pide el valor de una parmetro poblacional. Por
ejemplo, Cul es la distancia media en un solo sentido que deben viajar los estudiantes
que asisten a cualquier plantel del Colegio de Bachilleres?
Para contestar esta pregunta, hay que tomar una muestra de la poblacin y calcular la
media muestral x.
Imagina que eliges una muestra aleatoria de 100 distancias en un solo sentido y que
resulta una media de 16 Km Cul es la estimacin del valor medio de la poblacin?
Si se toma la media muestral como dicha estimacin, se estar efectuando una
estimacin puntual.
26
X
(desconocida)
27
Si x = 1 , entonces: z =
( 1)
1.0
=
= 1.67
0 .6
0.6
Si x = + 1 , entonces: z =
( + 1)
1 .0
=
= + 1.67
0. 6
0 .6
/ n = 0.6
1.0
+ 1.0
En consecuencia:
P ( 1 < X < + 1) = P(1.67 < Z < + 1.67)
= 2P(0 < Z < 1.67)
= 2 (0.4525) = 0.9050
La probabilidad de que la media de una muestra aleatoria est dentro de una unidad de
esta media poblacional es 0.9050. As, la probabilidad de que la media poblacional se
halle dentro de una unidad desde la media de una muestra es tambin igual a 0.9050.
Por lo tanto, el intervalo 15 a 17 es una estimacin por intervalo, con un nivel de
confianza de 0.9050 para la distancia media en un solo sentido recorrida por los
estudiantes del C.B.
28
/2
/2
1
(1 )
2
CADA COLA CONTIENE /2
/2
/2
Z (/2)
Z (/2)
E, error
E, error
mximo
mximoi
E = Z ( / 2)
X =
X Z ( / 2)
para
X + Z ( / 2)
n
confianza superior (LCS), del intervalo de confianza.
, lmite de
En la prctica nos vemos obligados con frecuencia a tomar decisiones relativas a una
poblacin sobre la base de informacin proveniente de muestras. Tales decisiones se
llaman decisiones estadsticas. Por ejemplo, podemos querer decir, basados en datos
muestrales, si un mtodo pedaggico es mejor que otro o si una moneda es falsa o no.
Al intentar obtener una decisin, es til hacer hiptesis (o conjeturas) sobre la poblacin
implicada. Tales hiptesis, que pueden ser o no ciertas, se llaman hiptesis estadsticas.
Son, en general, enunciados acerca de las distribuciones de probabilidad de las
poblaciones, que seguramente estudiaste en temas anteriores del curso de Estadstica.
En muchos casos realizamos hiptesis estadsticas con el nico propsito de rechazarla
o invalidarla. As, si queremos decidir si una moneda es falsa, hacemos la hiptesis de
que la moneda es buena (o sea, p = 0.5, donde p es la probabilidad de cara).
Anlogamente, si deseamos decidir si un procedimiento es mejor que otro, formulamos
la hiptesis de que no hay diferencia entre ellos (o sea, que cualquier diferencia
observada se debe simplemente a fluctuaciones en el muestreo de la misma poblacin).
Tales hiptesis, como recordars, son las hiptesis nulas y se representa por Ho.
Toda hiptesis que difiere se llama hiptesis alternativas. Por ejemplo: si una hiptesis
es p = 0.5, las hiptesis alternativas podran ser:
p = 0.7, p 0.5 p > 0.5. Una hiptesis alternativa a la hiptesis nula se representar
por Ha.
30
Si suponemos que una hiptesis particular es cierta pero vemos que los resultados
hallados en una muestra aleatoria difieren notablemente de los esperados bajo tal
hiptesis, entonces diremos que las diferencias observadas son significativas y nos
veramos inclinados a rechazar la hiptesis (o al menos a no aceptarla ante la evidencia
obtenida). As, si en 20 tiradas de una moneda salen 16 caras, estaramos inclinados a
rechazar la hiptesis de que la moneda es buena, aunque cabe la posibilidad de
equivocarnos.
Los procedimientos que nos capacitan para determinar si las muestras observadas
difieren significativamente de los resultados esperados, y por tanto nos ayudan a decidir
si aceptamos o rechazamos la hiptesis, se llaman contrastes (o test) de hiptesis o de
significacin o reglas de decisin.
Si rechazamos una hiptesis cuando debiera ser aceptada, diremos que se ha cometido
un error de tipo I. Por otra parte, si aceptamos una hiptesis que debiera ser rechazada,
diremos que se ha obtenido un error de tipo II. En ambos casos se ha producido un caso
errneo.
Para que las reglas de decisin (o contrastes de hiptesis) sean buenas, deben
disearse de modo que minimicen los errores de la decisin. Y no es una cuestin
sencilla, porque para cualquier tamao de la muestra, un intento de disminuir un tipo de
error puede ser ms grave que el otro, y debe alcanzarse un compromiso que disminuya
el error ms grave, La nica forma de disminuir ambos a la vez es aumentar el tamao
de la muestra, que no siempre es posible.
Al contrastar una cierta hiptesis, la mxima probabilidad con la que estamos dispuestos
a correr riesgo de cometer un error de tipo I se llama nivel de significacin de contraste.
Esta probabilidad, denotada a menudo por , se suele especificar antes de tomar la
muestra, de manera que los resultados obtenidos no influyan en nuestra eleccin.
En la prctica, es frecuente un nivel de significacin de 0.05 0.01, si bien se usan otros
valores, Si, por ejemplo, se escoge el nivel de significacin 0.05 ( 5%) al disear una
regla de decisin, entonces hay unas 5 oportunidades entre 100 de rechazar las
hiptesis cuando debiera haberse aceptado; es decir, tenemos un 95% de confianza de
que hemos adoptado la decisin correcta. En tal caso decimos que la hiptesis ha sido
rechazada al nivel de significacin 0.05, lo cual quiere decir que la hiptesis tiene una
probabilidad 0.05 de ser falsa.
Para ilustrar lo explicado anteriormente, suponemos que bajo cierta hiptesis la
distribucin de muestreo de un estadstico S es una distribucin normal con media s y
desviacin tpica S. As pues, la distribucin de la variable tipificada z dada por z = (S
s)/S, es la distribucin normal cannica (media 0, varianza1), como indica la siguiente
figura:
31
REGIN CRTICA
REGIN CRTICA
0.025
0.025
Z = 1.96
Z = 1.96
32
NIVEL DE SIGNIFICACIN,
Valores crticos de z para test
unilaterales
Valores crticos de z para test
bilaterales
0.10
1.28
1.28
1.645
y 1.645
0.05
1.645
1.645
1.96
y 1.96
0.01
2.33
2.33
2.58
y 2.58
0.005
2.58
2.58
2.81
y 2.81
0.002
2.88
2.88
3.08
y 3.08
33
SOLUCIN:
a) Con el 99.73% de confianza podemos decir que la media muestral x debe estar entre
X 3X y X + 3X o sea 3 N a + 3 N .
Como = 0.574
= 0.008
N=6
Se sigue que con el 99.73% de confianza, la media muestral debera estar entre
0.574 0.024 6 y 0.574 + 0.024 6 , o entre 0.564 y 0.584 cm. Luego nuestra regla
de decisin es como sigue:
Si una media muestral cae dentro del rango de 0.564 a 0.584, aceptamos que la
mquina funciona bien: Si no, concluimos que no funciona bien e investigamos la razn.
b) Se pueden anotar las observaciones en un grfico como en la siguiente figura,
llamado un grfico de control de calidad. Cada vez que se toma una muestra, se
representa por un punto concreto. En tanto que los puntos estn entre el lmite inferior
(0.564 cm.) y el superior (0.584 cm.), el proceso est bajo control. Cuando un punto
se sale de esos lmites de control (como sucede en la tercera muestra tomado el
jueves), existe la posibilidad de que algo falle, y se hace preciso investigarlo.
Lunes
Martes
Mircoles
0.584
0.574
0.564
34
Jueves
Viernes
RECAPITULACIN
PRUEBAS DE HIPTESIS
ETAPAS BSICAS
PRUEBA DE UN
VALOR
HIPOTTICO DE LA MEDIA
UTILIZANDO
LA
DISTRIBUCIN NORMAL
ERRORES DE TIPO I y II
PUNTUAL DE UN
PARMETRO
POR INTERVALO
ESTIMACIN
NIVEL DE CONFIANZA
ERROR
DE
MXIMO E
INTERVALO DE
CONFIANZA
ESTIMACIN
Cada una de las partes que conforman el esquema anterior, se relacionan con la
Inferencia Estadstica. Con base en el, elabora una sntesis de cada aspecto,
especificando cmo se interrelacionan.
35
ACTIVIDADES DE CONSOLIDACIN
AUTOEVALUACIN
37
BIBLIOGRAFA CONSULTADA
38