Вы находитесь на странице: 1из 44

INFERENCIA

ESTADÍSTICA
Geoestadística
Profesor: Nathalie Humeniy
nhumeniy@ucn.cl
DESCRIPTIVA
ESTADÍSTICA ESTIMACIÓN
INFERENCIAL
CONTRASTES
VARIABLES ALEATORIAS

Variables Discretas Variables Continuas

Binomial(n,p) Exponencial(𝜆)

Geométrica(p) Gamma(a,b)
DISTRIBUCIONES CONTINUAS DE INTERÉS

NORMAL T-STUDENT

CHI-CUADRADO F-FISHER
DISTRIBUCIÓN NORMAL
Distribución Distribución
Normal Normal Estándar

𝑿 ∼ 𝑵𝒐𝒓𝒎𝒂𝒍(𝝁, 𝝈𝟐 ) 𝒁 ∼ 𝑵𝒐𝒓𝒎𝒂𝒍(𝟎, 𝟏)

𝐸 𝑋 = 𝜇, 𝑉𝑎𝑟 𝑋 = 𝜎 2 𝐸 𝑍 = 0, 𝑉𝑎𝑟 𝑍 = 1

𝑥
1 −
1
𝑥−𝜇 2 𝑋−𝜇
𝐹 𝑥 =
2𝜋𝜎 2
𝑒 2𝜎2 𝑑𝑥 𝑍=
−∞ 𝜎
DISTRIBUCIÓN NORMAL
DISTRIBUCIÓN NORMAL EN EXCEL
■ =DISTR.NORM(x; media; desv_estándar; acum)
– “acum”= verdadero, entrega la probabilidad de la distribución
normal acumulada, 𝑃 𝑋 ≤ 𝑥 = 𝐹(𝑥).
– “acum”= falso, entrega la probabilidad de la distribución normal
puntual, 𝑃 𝑋 = 𝑥 = 𝑓 𝑥 .
■ =DISTR.NORM.ESTAND(z), devuelve la probabilidad de la
distribución normal estándar acumulada 𝑃 𝑍 ≤ 𝑧 = Φ(𝑧).
■ =DISTR.NORM.INV(probabilidad; media; desv_estándar),
devuelve el valor de la variable normal con probabilidad acumulada
específica, 𝑃 𝑋 ≤ 𝒙 = 𝑝.
■ =DISTR.NORM.ESTAND.INV(probabilidad), devuelve el valor de
la variable normal estándar con probabilidad acumulada específica,
𝑃 𝑍 ≤ 𝒛 = 𝑝.
EJEMPLO
■ 𝑍 ∼ 𝑁 0,1
𝑃 𝑍 = 0.5 = 𝜙 0.5
𝑃 𝑍 ≤ 0.5 = Φ 0.5
𝑃 𝑍 > 0.5 = 1 − 𝑃 𝑍 ≤ 0.5 = 1 − Φ 0.5
𝑃 −0.5 ≤ 𝑍 ≤ 0.5 = 𝑃 𝑍 ≤ 0.5 − 𝑃 𝑍 < −0.5 = Φ 0.5 − Φ −0.5
𝑃 𝑍 ≤ 𝑍0.7 = 0.7
𝑃 𝑍 > 𝑍0.7 = 0.7 ⟹ 𝑃 𝑍 ≤ 𝑍0.3 = 0.3
■ 𝑋 ∼ 𝑁 6,4
𝑃 𝑋=7
𝑃 𝑋≤7
𝑃 𝑋 >7 =1−𝑃 𝑋≤ 7
𝑃 5≤𝑋≤7 = 𝑃 𝑋≤7 −𝑃 𝑋 <5
𝑃 𝑋 ≤ 𝑥 = 0.7
Distribución t-Student
Distribución simétrica.

Su parámetro es 𝜈, llamado grados de libertad.


Si 𝑛 → ∞ se aproxima a la distribución Normal.
𝜈+1 −
𝜈+1
Γ 𝑥 2 2
𝑓 𝑥 = 𝜈 2 1−
Γ 𝜋𝜈 𝜈
2
GRAFICA DENSIDAD t-STUDENT
DISTRIBUCIÓN t-STUDENT EN EXCEL
■ =DISTR.T.N(x, grados_de libertad; acumulado), entrega la
probabilidad acumulada a la izquierda, 𝑃(𝑇 < 𝑥).
– Acumulado= verdadero. Entrega distribución acumulada.
– Acumulado= falso. Entrega distribución puntual.
■ =DISTR.T.CD(x; grados_de_libertad), entrega la probabilidad
acumulada a la derecha, 𝑃(𝑇 > 𝑥).
■ =DISTR.T.2C(x, grados_de_libertad), entrega la probabilidad de
izquierda y derecha, 𝑃 𝑇 ≥ 𝑥 = 𝑃 𝑇 ≤ −𝑥 + 𝑃 𝑇 ≥ 𝑥
■ =DISTR.T.INV(probabilidad, grados_de_libertad), entrega el valor
de la variable t-Student con probabilidad acumulada especificada en dos
colas.
■ =INV.T(probabilidad, grados_de_libertad), entrega el valor de la
variable t- Student con probabilidad acumulada especificada a la
izquierda.
Ejemplo

■ Considere 𝑇 ∼ 𝑡14 , calcule:

– 𝑃(𝑇 ≤ −2.145)
– 𝑃(𝑇 ≥ 2.145)
– 𝑃( 𝑇 ≥ 2.145)
– 𝑃 𝑇 ≥ 𝑡0.025 = 0.025
– 𝑃 𝑇 ≥ 𝑡0.025 = 0.05
Distribución Chi-Cuadrado
Distribución asimétrica.
Su parámetro es 𝜈 > 0, llamado grados de
libertad.
1 𝜈
−1 −
𝑥
𝑓 𝑥 = 𝜈 𝑥2 𝑒 2 , 𝑥>0
𝜈
22 Γ
2
GRAFICA DENSIDAD CHI-CUADRADO
CHI- CUADRADO EN EXCEL
■ =DISTR.CHICUAD(x, grados_de libertad; acumulado), entrega la
probabilidad acumulada a la izquierda, 𝑃(𝑋 < 𝑥).
– Acumulado= verdadero. Entrega distribución acumulada.
– Acumulado= falso. Entrega distribución puntual.
■ =DISTR.CHICUAD.CD(x; grados_de_libertad), entrega la
probabilidad acumulada a la derecha, 𝑃(𝑋 > 𝑥).
■ =INV.CHICUAD(probabilidad, grados_de_libertad), entrega el
valor de la variable Chi-Cuadrado con probabilidad acumulada
especificada a la izquierda.
■ =INV.CHICUAD.CD(probabilidad, grados_de_libertad), entrega el
valor de la variable Chi-Cuadrado con probabilidad acumulada
especificada a la derecha.
Ejemplo

■ 𝑋 ∼ 𝜒72

– 𝑃 𝑋 = 14
– 𝑃 𝑋 ≤ 14
– 𝑃 𝑋 ≥ 14
2
– 𝑃 𝑋 ≤ 𝜒0.95 = 0.95 Izquierda
2
– 𝑃 𝑋 ≥ 𝜒0.05 = 0.05 derecha
Distribución F-Fisher
Distribución asimétrica.

Sus parámetros son 𝑢 > 0 y 𝑣 > 0, llamados grados


de libertad.
𝑢
𝑢+𝑣 𝑢 2 𝑢
Γ
2 𝑣 𝑥 2 −1
𝑓 𝑥 = 𝑢 𝑣 𝑢+𝑣 , 𝑥>0
Γ Γ 𝑢𝑥 2
2 2 1+
𝑣
GRAFICA DENSIDAD F-FISHER
DISTRIBUCIÓN F-FISHER EN EXCEL
■ =DISTR.F.N(x; grados_de libertad1; grados_de_libertad2;
acumulado), entrega la probabilidad acumulada a la izquierda, 𝑃(𝐹 <
𝑥).
– Acumulado= verdadero. Entrega distribución acumulada.
– Acumulado= falso. Entrega distribución puntual.
■ =DISTR.F.CD(x; grados_de_libertad1; grados_de_libertad2),
entrega la probabilidad acumulada a la derecha, 𝑃(𝐹 > 𝑥).
■ =INV.F(probabilidad; grados_de_libertad1;
grados_de_libertad2), entrega el valor de la variable F-Fisher con
probabilidad acumulada especificada a la izquierda.
■ =INV.F.CD(probabilidad; grados_de_libertad1;
grados_de_libertad2), entrega el valor de la variable F-Fisher con
probabilidad acumulada especificada a la derecha
Ejemplo

■ 𝐹 ∼ 𝐹6,10

– 𝑃(𝐹 = 3.2)
– 𝑃(𝐹 ≤ 3.2)
– 𝑃 𝐹 ≥ 3.2
– 𝑃 𝐹 ≤ 𝐹0.95 = 0.95 izquierda
– 𝑃 𝐹 ≥ 𝐹0.05 = 0.05 derecha
PARÁMETROS Y ESTADÍSTICOS
Población Muestra
Medidas
(Parámetros) (Estadísticos)
𝑛
𝑖=1 𝑋𝑖
Media 𝜇 𝜇=𝑋=
𝑛
𝑛 2
𝑋𝑖 − 𝑋
Varianza 𝜎2 𝜎2 = 𝑆2 = 𝑖=1
𝑛−1

𝑋𝑖
Proporción 𝑝 𝑝=
𝑛
DISTRIBUCIÓN MUESTRAL MEDIA
Muestra Si 𝑋 es la media de una m.a.(n) tomada
1 𝑋1 de una población con distribución
𝑁 𝜇, 𝜎 2
Muestra
2 𝑋2
Muestra 𝝈𝟐
3 𝑋3 𝑿 ∼ 𝑵 𝝁,
𝒏


𝜎2
Muestra 𝜇𝑋 = 𝜇 𝜎𝑋2 =
k 𝑋𝑘 𝑛
EJEMPLO
■ Una empresa de material eléctrico fabrica bombillas que tienen una
duración que se distribuye normal con media 800 horas y desviación
estándar de 40 horas. Calcule la probabilidad de que una muestra
aleatoria de 16 bombillas tenga una vida promedio menor a 775
horas.

𝑋∼𝑁 800,402 𝑋 ∼ 𝑁 800,10


DISTRIBUCIÓN MUESTRAL DE LA MEDIA
2
CON VARIANZA 𝜎 DESCONOCIDA
Si 𝑋 y 𝑆 2 son la media y varianza de una m.a.(n) tomada de una población
con distribución 𝑁 𝜇, 𝜎 2 , pero se desconoce el valor de 𝜎 2.

𝑋−𝜇
𝑇= ∼ 𝑡𝑛−1
𝑆/ 𝑛

𝑡𝑛−1: distribución t-Student con n-1 grados de libertad


Ejercicio
■ Se ha seleccionado una muestra de 64 empleados de una compañía
de seguros, encontrándose que la desviación estándar del ingreso es
de $42000. Si se supone que los ingresos de los empleados se
distribuyen de manera normal con un ingreso medio de $538000,
determine:
– La probabilidad de que el ingreso promedio de la muestra sea de
a lo más $550532.
– La probabilidad de que el ingreso promedio de la muestra se
ubique entre $531200 y $544800.
DISTRIBUCIÓN MUESTRAL DE LA
VARIANZA
Si 𝑋 y 𝑆 2 son la media y la varianza de una m.a.(n) tomada de una
población con distribución 𝑁 𝜇, 𝜎 2

2
𝑛 − 1 𝑆
𝜒2 = ∼ 𝜒 2
𝑛−1
𝜎2

2
𝜒𝑛−1 : distribución Chi-cuadrado con n-1 grados de libertad
Ejemplo
■ El gerente general de una casa comercial ha determinado que la
cantidad de dinero que paga cada cliente es modelado por una
distribución normal con una desviación estándar de 16 ($mil).
– Si se selecciona aleatoriamente el pago realizado por 26 clientes,
determine la probabilidad de que la varianza de sus pagos esté
entre 150 y 350 ($𝑀2 ).
– Para una muestra de 21 clientes, determine la probabilidad de
que la desviación estándar obtenida se ubique sobre los 20 ($M)
Teorema del Limite Central (TLC)
𝑋 es la media de una m.a.(n) tomada de una
población con media 𝜇 y varianza 𝜎 2

𝒏 → ∞, 𝑛 ≥ 30

𝑋−𝜇
𝑍= ∼ 𝑁 0,1
𝜎/ 𝑛
Ejemplo
■ El viaje en un autobús especial para ir del campus de una
universidad al otro campus en la misma ciudad tarda, en
promedio, 28 minutos, con una desviación estándar de 5
minutos. En cierta semana un autobús realizó el viaje 40
veces. ¿Cuál es la probabilidad de que el tiempo promedio
del viaje sea mayor a 30 minutos?
TEST DE HIPÓTESIS
Objetivo
•Tomar una decisión mediante el contraste de dos hipótesis:
•Hipótesis Nula 𝐻0
•Hipótesis Alternativa 𝐻𝐴 o 𝐻1
Método
•Seleccionar una muestra aleatoria que proporciona evidencia para
respaldar o no la hipótesis nula.
Rechazo
•Rechazar 𝐻0 en favor de 𝐻𝐴
•No se rechaza 𝐻0 , no hay evidencia suficiente.
𝐻0
𝐻0 Falsa
Verdadera
•No rechazar 𝐻0 •Correcto •Error
•Rechazar 𝐻0 •Error •Correcto
•Rechazar 𝐻0 dado que es
verdadera
Error tipo I • 𝑃 𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼 = 𝛼
• 𝛼: nivel de significancia

•No rechazar 𝐻0 dado que es


falsa
Error tipo II • 𝑃 𝐸𝑟𝑟𝑜𝑟 𝑡𝑖𝑝𝑜 𝐼𝐼 = 𝛽
• 1 − 𝛽: potencia
ESTADÍSTICO DE PRUEBA

TH para 𝝁, con TH para 𝝁, con


TH para 𝒑
𝝈𝟐 conocido 𝝈𝟐 desconocido

𝑝 − 𝑝0
𝑋 − 𝜇0 𝑋 − 𝜇0 𝑍𝑜𝑏𝑠 = ∼ 𝑁(0,1)
𝑍𝑜𝑏𝑠 = ∼ 𝑁(0,1) 𝑇𝑜𝑏𝑠 = ∼ 𝑡𝑛−1 𝑝0 (1 − 𝑝0 )
𝜎/ 𝑛 𝑆/ 𝑛
𝑛
Tipos de hipótesis

Bilateral Unilateral

𝐻0 : 𝜃 = 𝜃0 𝐻0 : 𝜃 = 𝜃0
𝐻𝐴 : 𝜃 ≠ 𝜃0 𝐻𝐴 : 𝜃 < 𝜃0

𝐻0 : 𝜃 = 𝜃0
𝐻𝐴 : 𝜃 > 𝜃0
Test Bilateral
𝐻0 : 𝜃 = 𝜃0
𝐻𝐴 : 𝜃 ≠ 𝜃0
Test Unilateral
𝐻0 : 𝜃 = 𝜃0 𝐻0 : 𝜃 = 𝜃0
𝐻𝐴 : 𝜃 < 𝜃0 𝐻𝐴 : 𝜃 > 𝜃0
Valor Crítico
• Límite zona de rechazo
• Bilateral: 𝑍𝛼 , 𝑍1−𝛼 , 𝑡 𝑛−1,𝛼 , 𝑡 𝑛−1,1−
𝛼
2 2 2 2
• Unilateral: 𝑍𝛼 , 𝑍1−𝛼 , 𝑡(𝑛−1,𝛼) , 𝑡(𝑛−1,1−𝛼)
Valor-p
• Nivel de significancia mas bajo
• Bilateral: 𝑃 𝑍 ≥ 𝑍𝑜𝑏𝑠 = 2𝑃 𝑍 ≤ 𝑍𝑜𝑏𝑠 ,
𝑃 𝑇 ≥ 𝑇𝑜𝑏𝑠 = 2(𝑇 ≤ 𝑇𝑜𝑏𝑠 )
• Unilateral: 𝑃 𝑍 ≤ 𝑍𝑜𝑏𝑠 , 𝑃 𝑍 ≥ 𝑍𝑜𝑏𝑠 ,
𝑃 𝑇 ≤ 𝑇𝑜𝑏𝑠 , 𝑃 𝑇 ≥ 𝑇𝑜𝑏𝑠
Ejemplo
■ En una muestra aleatoria de 100 mujeres, registradas en Estados
Unidos el año pasado, reveló una vida promedio de 71.8 años. Si se
supone una desviación estándar de la población de 8.9 años, ¿Podría
indicar que la vida media actual en las mujeres de Estados Unidos es
mayor a 70 años? Utilice un nivel de significancia de 0.05.
Ejemplo

■ Un fabricante de equipo deportivo desarrolló un nuevo sedal para


pesca sintético que según afirma, tiene una resistencia media a la
rotura de 8 Kg con una desviación estándar de 0.5 kg. Se toma una
muestra aleatoria de 50 sedales para probar que el fabricante está
equivocado, con un nivel de significancia de 0.01. Se observó que la
resistencia media a la rotura es 7.8 kg.
Ejemplo

■ El Edison Electric Institute publica cifras del número de kilowat-hora


que gastan anualmente varios electrodomésticos. Se afirma que una
aspiradora gasta un promedio de 46 KWh al año. Si una muestra
aleatoria de 12 hogares indica que las aspiradoras gastan en
promedio 42 KWh con una desviación estándar de 11.9 KWh al año,
¿esto sugiere que las aspiradoras gastan, en promedio, menos de 46
KWh al año? Suponga que el gasto de KWh se distribuye normal
ESTADÍSTICOS DOS POBLACIONES

TH para 𝜇1 − 𝜇2, con


TH para 𝜎12 /𝜎22
𝜎12 y 𝜎22 conocidos

𝑋1 − 𝑋2 − 𝑑0
𝑍𝑜𝑏𝑠 = ∼ 𝑁(0,1) 𝑆12
𝜎12 𝜎22 𝐹𝑜𝑏𝑠 = 2 ∼ 𝐹(𝑛1 − 1, 𝑛2 − 1)
+
𝑛1 𝑛2
𝑆2
TH para 𝜇1 − 𝜇2, con 𝜎12 y 𝜎22 TH para 𝜇1 − 𝜇2, con 𝜎12 y 𝜎22
desconocidos, pero iguales desconocidos, pero distintas

𝑋1 − 𝑋2 − 𝑑0
𝑋1 − 𝑋2 − 𝑑0 𝑇𝑜𝑏𝑠 = ∼ 𝑡𝑣
𝑇𝑜𝑏𝑠 = ∼ 𝑡𝑛1 +𝑛2 −2
1 1 𝑆12 𝑆22
𝑆𝑝 + +
𝑛1 𝑛2 𝑛1 𝑛2

2
𝑆12 𝑆22
+
𝑛1 𝑛2
𝑛1 − 1 𝑆12 + 𝑛2 − 1 𝑆22 𝑣= 2 2
𝑆𝑝2 = 𝑆12 𝑆22
𝑛1 + 𝑛2 − 2
𝑛1 𝑛2
+
𝑛1 − 1 𝑛2 − 1
Ejemplo

■ La temperatura media durante el mes de julio en dos ciudades distintas es:


ciudad A: 𝑋1 = 36° 𝜎1 = 5°
ciudad B: 𝑋2 = 34° 𝜎2 = 4°
¿Existe evidencia para indicar que la ciudad A es más calurosa que la ciudad B?
Ejemplo

■ Las notas de dos alumnos, en las 9 asignaturas del primer curso, son
Alumno A: 5 7 7 6 5 5 8 6 8
Alumno B: 5 6 8 9 7 6 5 8 10
¿Puede indicar que el alumno dos tiene mejores calificaciones que el alumno 1?