Академический Документы
Профессиональный Документы
Культура Документы
Inferencia Estadstica
1. - Introduccin
2.-Estimacin de parmetros.
2.1. - Estimacin puntual.
2.2. - Estimacin por intervalos de confianza.
3.- Test de hiptesis:
3.1 - Algunos test paramtricos clsicos.
3.2- Test no paramtricos
OBJETIVO
El objetivo del muestreo es obtener
conclusiones precisas, fiables y de inters
sobre las caractersticas de los procesos,
servicios, materiales, productos, etc.
(poblacin) al menor coste posible utilizando
procedimientos estadsticos.
- medir
- analizar
- o comprobar
la totalidad de
- la poblacin
- el lote
- el conjunto que es objeto de estudio etc.
"Las compaas se aprueban en innovacin en su red comercial. Solamente un15% de las empresas se suspende,
y el 50% de los directivos encuestados se otorgan entre un 6 y un 7 de nota a la innovacin ocurrida desde 2008".
Esta es una de las conclusiones del estudio "Reinventarse para avanzar. Innovando en el rea comercial" que hemos realizado
los profesores del IESE Cosimo Chiesa y Julin Villanueva.
El informe sobre la gestin de redes comerciales en Espaa, apunta tambin que las empresas que ms han sufrido con la crisis
son las que menos han innovado comercialmente en estos aos. Asimismo, se observa que las polticas en las que ha habido ms
innovacin son tambin aquellas que han dado mejor resultado. El estudio tambin indica que donde hay mayor innovacin comercial
es en la organizacin, en la motivacin y en la supervisin; mientras que donde menos innovacin se observa es en la remuneracin
y en la seleccin.
Solamente el 15% de los sectores mantienen o crecen el volumen de 2008, mientras que para el 69% decrece .
Si juntamos por tanto la cada de ventas con la cada de precios, el resultado es el ya conocido por todos: una rpida erosin
de la rentabilidad. Ante esta situacin, la necesidad de innovacin y ventas incrementales en otros mercados se vuelven crticas.
15/11/2016 13
Razones para realizar el muestreo
TEST DE HIPTESIS
- Sobre parmetros
- Sobre distribuciones
m X S 2 2
n 1 P p
Como estimadores de los parmetros poblacionales se utilizan los
estadsticos muestrales anlogos.
Situacin Real
Ho es cierta Ho es falsa
Decisin Test
Acepta HO Ok Erro II
Rechazar Ho Error I Ok
ERROR TIPO I
Rechazar la hiptesis nula cuando es cierta (Error de Primera
Especie).
ERROR TIPO II
Aceptar la hiptesis nula cuando es falsa (Error de Segunda
Especie).
Pa CURVA CARACATERSTICA
1- 1
Pr(aceptar)
0,8
0,6
0,4
0,2
0 m0 m
19 21 23 25 27 29 31
VALOR DE LA MEDIA POBLACIONAL
0,8
0,6
0,4
0,2
0
0 0,2 0,4 0,6 0,8 1
True Mean
TEST DE HIPTESIS E INFERENCIA ESTADATICA
ELEMENTOS DE UN TEST DE HIPTESIS
P-valor
- Si aceptamos H0 no quiere decir que sta sea necesariamente cierta, sino que no
tenemos argumentos para rechazarla.
TEST DE HIPTESIS E INFERENCIA ESTADATICA
TIPOS DE TEST DE HIPTESIS PARAMTRICOS
P( LCI x LCS) P 0 z / 2 x 0 z / 2 / 1
n n
Si no ha cambiado el valor de quedara:
0 z / 2 1 /( / n ) 0 z / 2 1 /( / n )
n n
n z / 2 z / d (( z / 2 z ) 2 / 2 ) * 2
Donde d=/ 1- 0/ y = 1- 0/
Podemos admitir con un nivel de significacin del 10% que el promedio de las p.p.m. de
vitamina C en un alimento es de 70 si asumimos que =20 y al evaluar n= 9 muestras
diferentes hemos obtenido los siguientes valores 69,60,80,85,68,74,60,86,92 ?
Solucin:
Como x 74.89 est dentro del intervalo 70 1.645 20/9 =(59, 81) aceptamos la hiptesis nula y concluimos que
la media de las ppm puede ser de 70.
TEST DE HIPTESIS E INFERENCIA ESTADATICA
TEST SOBRE LA MEDIA
Ejemplo de Test de hiptesis sobre la media de una poblacin normal,
Hiptesis nula simple contra alternativa bilateral (H0: m=m0)
Una mquina envasadora se ajust a 2000 grs. En un control rutinario se toma una
muestra de 15 bolsas cuyos pesos se muestran a continuacin:
1989, 2015, 1962, 2013, 1983, 1989, 1992, 2011, 1958, 2023, 1980, 1977, 1994, 2017, 2001
Podemos admitir con un nivel de significacin del 5% que el promedio de las p.p.m. de los jvenes de un colegio est
por debajo de lo habitual (70) si asumimos que =20 y al contar las pulsaciones de n= 9 alumnos hemos obtenido los
siguientes valores 69,60,80,85,68,74,60,86,92 ? (admitamos que las p.p.m. siguen un distribucin normal )
Solucin:
De los datos obtenemos: S=11.57, y de la tabla de la Normal z0.05=1.645
Solucin:
20
P( x 80,96 / 72) P( N (72, ) 80,96)
9
80,96 72
(1,34) 0,9099
6,667
Solucin:
S n 1
y el contraste: Aceptar H0 si
x 0 t n 1
n
Como 32.4 < 35 - 1.833 (15.70/10 ) =33,13 rechazamos H0 y concluimos que el
La resistencia media mnima de unas barras de acero debe ser 1200 Kg/cm2 . Si 4
barras de acero han dado una resistencia media de 1195 Kg/cm2 y una S=2.
Podemos admitir con un nivel de significacin del 5% que el lote de barras
cumple la normativa?
a) Si admitimos que =3
b) Si nos basamos solo en los datos muestrales
c) Calcular en ambos casos el riesgo si la resistencia media fuera
realmente 1199 Kg/cm2
/2 S n 1
x t n 1
n
Solucin
Con los datos obtenemos x 135 y S=10.54
128.8, 141.2
10
x z / 2 135 1.96
n 10
TEST DE HIPTESIS E INFERENCIA ESTADATICA
ESTIMACIN POR INTERVALOS DE CONFIANZA
Hiptesis nula simple contra alternativa bilateral (H0: P=P0 H1: PP0)
Aceptar H0 si:
P0 (1 P0 )
p P0 z / 2
n
Aceptar H0 si: P0 (1 P0 )
p P0 z
n
P0 (1 P0 )
p P0 z
n
Solucin:
La hiptesis a contrastar es H0: P=P0 =0,05 contra H1: PP0 y la regla de decisin es aceptar
si:
P0 (1 P0 )
p P0 z / 2
n
0,05.0,95
0, 01455
2
Como p 0,10 0,05 1,96
20 20
Solucin:
6
En nuestro caso p 0.03 z 1.645
200
PQ 0,025(1 0,025)
p N ( P, ) p N (0,025, ) N (0,025; 0,011)
n 200
0,037 0,025
P( p 0,037 / P 0,025) P( N (0,025;0,011) 0,037) (1,09) 0,8621
0,011
p(1 p)
p z / 2
n
Solucin:
p(1 p)
El intervalo para la proporcin poblacional P es p z / 2
n
0.60(1 0.60)
0.60 1.96 0.5321 0.668 53.21% 66.80%
200
p(1 p)
p z / 2
n
0.60(1 0.60)
0.60 1.96 0.5321 0.668 53.21% 66.80%
200
Es decir:
(n 1) S n21 (n 1) S n21
2 , 2
n 1, / 2 n 1,1 / 2
(8 1)16 (8 1)16
2 , 2
(81), 0, 05 (81), 0,95
112 112
14,067 , 2,167 7.96 , 51.68
TEST DE HIPTESIS E INFERENCIA ESTADATICA
ESTIMACIN POR INTERVALOS DE CONFIANZA
Intervalos de confianza para la VARIANZA:
Para estudiar el espesor de la capa de imprimacin de la carrocera de un determinado modelo de automvil se examinaron
10 vehculos obtenindose los siguientes valores
{ 45, 40, 44, 43, 45, 43, 46, 45, 44, 45 }
medidos en micras. En el supuesto de que sigan una distribucin NORMAL :
a) Calcular un intervalo de confianza al nivel =0'05 para el promedio del espesor.
b) Lo mismo para la varianza del espesor.
Aceptar H0 si
S i2
2
Fni 1 , n j 1 siendo i la muestra de mayor S 2
Sj
Solucin:
Si2
Fni1 ,n j1 siendo i la muestra de mayor S 2
El contraste es: aceptar H0 si Sj2
Como 0.075/0.0066=11.36 > 9.12 debemos rechazar la hiptesis nula y admitir que el nuevo mtodo tiene ms
dispersin que el oficial
Aceptar H0 si:
/2 1 1 S2 S2
x1 x2 t n1 n2 2 S con S
n1 n2 n n
donde los subndices i=1,2 diferencian los tamaos de muestra, medias y varianzas
muestrales respectivas
Aceptar H0 si:
donde los subndices i=1,2 diferencian los tamaos de muestra, medias y varianzas
muestrales respectivas
el frmaco a la dosis recomendada durante un mes a los mismos pacientes, se volvieron a realizar los anlisis
obtenindose los valores 190,220,200,180,190,260,240,241,200. Con un nivel de significacin del 5%, y admitiendo
que el contenido en colesterol sigue una distribucin normal qu podemos decir respecto de la eficacia del
frmaco?
Solucin:
De los resultados y de la tabla de la t, obtenemos:
t0.02516=2.12
El test es: H0:1=2, H1:12
Observar que podemos detectar como significativa cualquier diferencia de medias por pequea
que sea, si existe, haciendo n suficientemente grande. ( si n entonces la varianza de la media
muestral tiende a cero y la campana de cada media sera un lnea vertical distinta de la otra)
Adems, si n= estamos comparando las poblaciones completas que saldrn diferentes si existe
la ms mnima diferencia real entre ellas.
1,2 0,12
0,8 0,08
0,4 0,04
0 0
9 9,5 10 10,5 11 11,5 12 0 2 4 6 8 10 12 14 16 18 20 22 24
Diferentes Distribuciones
de Medias
/21 1
x1 x2 t n1 n2 2 S
n1 n2
/2 S S
2 2
x1 x2 t2 n2 1 2
n
1 1
25,2 24,9 t10
0 , 05 / 2
5 2 0,656
10 5
(-0,4761 1,076)
76
TEST DE HIPTESIS E INFERENCIA ESTADATICA
CASO CONCRETO DE DATOS APAREADOS
En el ejercicio anterior parece cuanto menos llamativo, el hecho de que no salga un efecto significativo del frmaco cuando
en todos y cada uno de los pacientes ha habido una reduccin del colesterol. Cual puede ser la razn?. Debemos tener en
cuenta que el efecto del frmaco puede verse enmascarado por las diferencias en las tasas de colesterol entre los pacientes
tratados (son mayores las diferencias entre pacientes que entre cada paciente antes y despus del tratamiento). Puede
En los casos en que los datos pueden obtenerse por parejas (antes, despus) debemos recurrir al test
t de datos apareados calculando las correspondientes diferencias, con su signo, (que miden el efecto
real del frmaco en cada paciente) y aplicando el test de que la media poblacional de estas
diferencias es cero.
Despus 190 220 200 180 190 260 240 241 200
/2 Sd
H0:d=0, H1:d0 y aceptar H0 si xd tn 1
n
11.67
Y como10,22 2.306 9.51 rechazamos H0 y admitimos la efectividad del frmaco.
9
Aceptar H0 si
1 1 n1 p1 n2 p 2
p1 p 2 z / 2 P(1 P)
siendo P
n1 n2 n1 n2
Solucin:
1 1 n1 p1 n2 p 2
Y el contraste es aceptar si p1 p 2 z / 2 P(1 P) siendo P
1
n n 2 n1 n2
En nuestro caso p1=10/122=0.082, p2= 18/205=0.088 , z/2= 1.96 y el estadstico de contraste vale
0.062. Como 0,088-0,082= 0,006 < 0.062 debemos aceptar la hiptesis nula y concluir que no hay
diferencias entre las proporciones poblacionales de fallos durante el da o la noche.
1 1
p1 p2 z / 2 P(1 P)
n1 n2
n1 p1 n2 p2
con P
n1 n2
Solucin:
1 1
0,625 0,40 z0,10 / 2 0,538(1 0,538)
50 80
50.0,40 80.0,625
con P 0,538
50 80
(0,08 , 0,3726)
Oi 1
i n
3. Calculamos las frecuencias tericas o esperadas ti en cada intervalo (nmero de
valores que cabra esperar en el intervalo i si la distribucin fuera realmente la
supuesta ):
ti npi
4. Calculamos el estadstico:
z
k
Oi ti 2
i 1 ti
z
Oi ti
k 2
k2 s 1
i 1 ti
Re chazar 0 si z k( s) 1
Aceptar 0 si z k( s) 1
2k-s-1
742.5 5
742.5-745 10
745-747.5 16
747.5-750 20
750-752.5 21
752.5-755 15
7
755-757.5
6
757.5
Puede aceptarse, con un nivel de significacin =0.05, que la capacidad de dichos envases sigue una
distribucin N(m=750 c.c., =5 c.c.)?
ai 1 750 ai 750
Consideramos ai , ai 1 los lmites del intervalo Ci; Ser pi
5 5
z 1.3670
i 1 ti
Como z 14.1 , la conclusin es que no podemos rechazar 0 y debemos aceptar que la capacidad
de los envases sigue la distribucin propuesta.
0,98 0,05
1,36 14,1
Ejemplo: Segn los datos de la tabla siguiente podemos considerar que son
independientes el sexo y el color del coche elegido?
Sexo
Varones 10 36 14
Mujeres 20 9 11
En la tabla anterior:
N es el nmero total de observaciones
Oij es el nmero de valores observados en nivel i del factor A y el nivel j del factor B
tij es la frecuencia terica, si los factores fueran independientes, correspondientes al nivel i del
factor A y al nivel j del factor B.
Oi. total de frecuencias observadas en la fila i
O.j total de frecuencias observadas en la columna j
pij P( Ai B j ) P( Ai ) P( B j ) pi p j
con i=1n, j=1m. Entonces:
Oi O j Oi O j
t ij Np ij Np i p j N
N N N
Puede demostrarse, como en el apartado anterior, que si la hiptesis nula es cierta:
z
n m o
ij tij
2
(2n1)( m1)
i 1 j 1 tij
2 ( )
Aceptar 0 si z ( n 1)( m 1)
2 3 O t ij
2
El estadstico z
ij
ser:
i 1 j 1 t ij
z
10 18
2
36 27
2
...
11 10
2
16.556
18 27 10
=0,05
5,99 16,55
Total 50 40 30 n= 120
Podemos afirmar con un nivel de confianza del 5 % que el tipo del detergente es
independiente de la clase a la que pertenecen los consumidores?