Вы находитесь на странице: 1из 118

O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E STADÍSTICA T EÓRICA (I NFERENCIAL )

Joss Sánchez-Pérez1 (Facultad de Economía, UASLP)

joss.sanchez@uaslp.mx

Enero - Junio, 2018

1 www.sites.google.com/site/josssanchezperez/
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

P ROGRAMA TEMÁTICO Y EVALUACIÓN

Variables aleatorias y
algunas distribuciones
importantes
(recordatorio) 3 exámenes parciales:
Estimación puntual 1er examen (40 %)
2o examen (20 %)
Estimación por 3er examen (40 %)
intervalos de confianza
Prueba de hipótesis
Participaciones (extra)
Niveles de significancia
alcanzados
Modelos lineales (MCO)
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

B IBLIOGRAFÍA

Estadística matemática con aplicaciones


Dennis D. Wackerly, William Mendenhall & Richard L. Scheaffer
Ed. CENGAGE Learning
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

0. Preliminares
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

VARIABLES ALEATORIAS

Abstract nonsense: Transformar todos los posibles resultados de un


espacio muestral en cantidades numéricas.

D EFINITION
Sea (Ω, F , P) un espacio de probabilidad. Una variable aleatoria es
una función
f :Ω!R

D EFINITION
Se dice que una variable aleatoria X es discreta si el número de
valores que puede tomar es contable.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Si X es una variable aleatoria discreta y a 2 R:
X = a es el evento numérico que contiene todos los puntos
muestrales a los que se les asignó el número a.
P(X = a) := p(a) es la suma de las probabilidades de todos los
puntos muestrales de Ω que tienen asignado el valor a.

E XAMPLE
Considera el experimento de lanzar dos monedas y observar los
resultados. Define la v.a.d. X como el número de “águilas”
observadas, entonces...

E XAMPLE
Se lanza un par de dados. Define la v.a.d. X como la suma de las caras
superiores, entonces...
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Sean (Ω, F , P) un espacio de probabilidad y X una v.a.d. sobre Ω. Se
llama a p(x) = P(X = x) función de probabilidad si:
I) p(x) 0 8x
II ) ∑x p(x) = 1

D EFINITION
La función de distribución acumulativa de la v.a.d. X está dada por:

F(x) : = P(X x) = ∑ p(xi )


xi x
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Sea X una v.a.d. con función de probabilidad p(x). Entonces,
I) Valor esperado de X:

E(X ) = µ = ∑x p(x)
x

II ) Varianza de X:
h i
V (X ) = σ 2 = E (X µ )2

III ) Covarianza de X1 , X2 :

Cov(X) = E [(X1 µ1 ) (X2 µ2 )]


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En un problema de una prueba aplicada a niños pequeños, se les pide
que hagan corresponder cada uno de los cuatro dibujos de animales
con la palabra que identifica a ese animal. Si un niño asigna
aleatoriamente las cuatro palabras a los cuatro dibujos,
A) Encuentra la distribución de probabilidad para X, el
número de correspondencias correctas.
B) Determina la media y varianza para el número de
correspondencias correctas.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Con el propósito de verificar la exactitud de sus estados financieros,
las compañías tienen auditores permanentes para verificar los
asientos contables. Supóngase que los empleados de una compañía
efectúan asientos erróneos en el 5 % de las veces. Si un auditor
verifica tres asientos al azar:
A) Determina la distribución de probabilidad para X, el
número de errores detectado por el auditor.
B) Calcula la probabilidad de que el auditor detecte más de
un error.
C) Calcula el número de errores esperado y la varianza de
éstos, al verificar los asientos.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En un juego de póker una persona recibe $15 cuando saca una J o una
reina y recibe $5 si saca un rey o un as de la baraja de 52 cartas. Si
saca cualquier otra carta tiene que pagar $4. ¿Cuál es la ganancia
esperada para una persona que entra en el juego?.

E XAMPLE
Cinco pelotas numeradas, 1, 2, 3, 4 y 5 se encuentran en una urna. Se
sacan dos pelotas al azar de las cinco, y se anotan sus números.
Encontrar la distribución de probabilidad para lo siguiente:
A) El mayor de los dos números seleccionados.
B) La suma de los dos números seleccionados.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En determinado sistema de producción de artefactos electrónicos,
aproximadamente 9 % tienen defectos. Si se eligen al azar 3
artefactos, determinar la media y la varianza del número de
artefactos que no tienen defectos.

E XAMPLE
El gerente de un almacén en una fábrica ha construido la siguiente
distribución de probabilidad para la demanda diaria (número de
veces utilizada) para una herramienta en particular,

x 0 1 2
p(x) 0.1 0.5 0.4

Le cuesta a la fábrica $110 cada vez que se utiliza tal herramienta.


Encontrar la media, la varianza y la desviación estándar del costo
diario para el uso de tal herramienta.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D ISTRIBUCIÓN BINOMIAL

¿Cuándo utilizarla?

I) El experimento consta de n pruebas idénticas.


II ) Cada prueba tiene dos resultados posibles (éxito o
fracaso).
III ) La probabilidad (p) de tener éxito en una sola prueba
permanece constante de prueba en prueba.
IV ) Las pruebas son independientes.
V) La v.a.d. bajo estudio es X, el número de éxitos
observados en las n pruebas.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Una v.a.d. X tiene una distribución de probabilidad binomial, basada
en n pruebas, con probabilidad de éxito p, sii:
n x
p(x) = p (1 p)n x
x
para x = 0, 1, ..., n y 0 p 1

T HEOREM
Si X B(n, p), entonces:

µ = E(X) = np

σ2 = V (X) = np(1 p)
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Muchas compañías de energía eléctrica han empezado a promover el
ahorro de energía al ofrecer descuentos a consumidores que
mantienen su consumo de energía por debajo de ciertas normas de
subsidio establecidas. Un reciente reporte informa que el 70 % de los
habitantes de una comunidad han reducido suficientemente el uso de
energía eléctrica para poder disfrutar de los descuentos. Si se
selecciona al azar cinco residentes, encontrar la probabilidad de que:
A) Los cinco califican para tarifas más favorables.
B) Al menos cuatro califican para tarifas más favorables.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Diez motores son empaquetados para la venta en cierto almacén. Los
motores se venden a $1000 cada uno, pero se aplica una garantía de
reembolso doble"por cada artículo defectuoso que recibe el cliente.
Calcular la ganancia esperada del vendedor si la probabilidad de que
salga defectuoso un motor es de 0.08 (suponiendo que la calidad de
los motores son independientes entre sí).

E XAMPLE
Un examen de opción múltiple está compuesto de 15 preguntas, con
cinco respuestas posibles cada una, de las cuales solamente una es
correcta. Supóngase que uno de los estudiantes que realizan el
examen contesta las preguntas al azar. ¿Cuál es la probabilidad de
que conteste correctamente al menos 10 preguntas?.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Un sistema de protección contra cohetes está construido con n
unidades de radar que funcionan independientemente, cada una con
probabilidad de 0.9 de detectar un cohete que ingresa en la zona que
cubren todas las unidades.
A) Si n = 5 y un cohete entra en la zona, ¿cuál es la
probabilidad de que exactamente cuatro unidades
detecten el cohete?. ¿Al menos una unidad?.
B) ¿Cuál debe ser el valor de n para que la probabilidad de
detectar el cohete al entrar en la zona, sea de 0.999?.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
La experiencia ha demostrado que el 30 % de todas las personas
afectadas por cierta enfermedad, se recupera. Una compañía
farmacéutica desarrolló una nueva vacuna. Se seleccionaron al azar
10 personas con la enfermedad en cuestión y se les administró la
vacuna; poco después algunas se recuperaron.
A) ¿Cuál es la probabilidad de que 5 personas infectadas se
recuperen?.
B) ¿Cuál es la probabilidad de que al menos 9 de las 10
personas infectadas se recuperen?.
C) Calcular la probabilidad de que a lo más 2 personas
infectadas se recuperen.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D ISTRIBUCIÓN DE P OISSON

¿Cuándo utilizarla?

I) Los eventos aleatorios ocurren de manera independiente


con una velocidad constante en el tiempo o espacio.
II ) La v.a.d. bajo estudio es X, el número de eventos
independientes que ocurren a una rapidez constante en
el tiempo o espacio.
Por ejemplo:
A) Número de personas que llegan a una tienda de
autoservicio en un tiempo determinado (en general,
líneas de espera).
B) Número de solicitudes de seguro procesadas en un
periodo específico.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Una v.a.d. X tiene una distribución de probabilidad de Poisson, con
parámetro λ (número promedio de ocurrencias del evento aleatorio
por unidad de tiempo), sii:

λx λ
p(x) = e
x!
para x = 0, 1, 2, ... y λ > 0.

T HEOREM
Si X Poisson(λ), entonces:

µ = E(X ) = λ

σ 2 = V (X ) = λ
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Un sistema de ronda de policía está ideada de tal manera que un
policía puede visitar cierta localidad de su ronda X = 0, 1, 2, ... veces
en periodos de media hora y el sistema está arreglado de tal forma
que pasa por cada localidad un promedio de una vez por periodo. Si
X tiene aproximadamente una distribución de probabilidad de
Poisson, calcular la probabilidad de que el policía: a) No pase por la
localidad en un periodo de media hora; b) La visite una vez; c) La
visite dos veces; d) La visite al menos una vez.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El promedio mensual de accidentes en una fábrica resulta ser igual a
3. a) Calcular la probabilidad de que ocurran 5 accidentes en un
periodo similar. b) ¿Cuál es la probabilidad de que en dos meses
haya al menos 2 accidentes?. c) ¿Cuál es la probabilidad de que
ocurran al menos 4, pero no más de 6 accidentes en un mes?

E XAMPLE
Sea X Poisson(2). Encontrar P(X = 4), P(X < 3), P(X 3) y
P(X 3 j X 2).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
De acuerdo a un estudio estadístico, 185 personas murieron en
12, 438 incendios en hoteles y moteles en cierto año, o sea
aproximadamente 1.5 muertos por cada 100 incendios.
A) ¿Cuál es la probabilidad de que el número de muertos
exceda de ocho, si en una región ocurrieron 300
incendios en hoteles y moteles?
B) Encontrar la probabilidad de que el número de muertos
no exceda de seis, si ocurrieron 200 incendios en hoteles
y moteles.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

VARIABLES ALEATORIAS CONTINUAS

Abstract nonsense: Es un tipo de v.a. que toma cualquier valor en un


intervalo.

D EFINITION
Sean (Ω, F , P) un espacio de probabilidad y X una v.a. cualquiera
sobre Ω. La función de distribución de X, F(x), está dada por:

F(x) : = P(X x) para x 2 R

R EMARK
La función de distribución de una v.a. podrá determinar si ésta es discreta o
continua.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Si X B(3, 1/2), ¿qué es F(x)?. ¡Graficar!.

T HEOREM (P ROPIEDADES )
Si F(x) es una función de distribución para la v.a. X, entonces:
I) lı́m F(x) = 0
x! ∞
II ) lı́m F(x) = 1
x! ∞
III ) x1 > x2 ) F ( x1 ) F(x2 )
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Una v.a. X se dice continua si su función de distribución F(x) es
continua 8x 2 R.

R EMARK
Para una v.a.c. X se tiene que, para cualquier x 2 R:

P(X = x) = 0

D EFINITION
Sea F(x) la función de distribución de una v.a.c. X. La función de
densidad de probabilidad para X, f (x), está dada por:

d [F(x)]
f (x) =
dx
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

R EMARK
Se puede deducir que, Z x
F(x) = f (t)dt

Una representación gráfica para la relación anterior es: (dibujarla!)

T HEOREM
Si f (x) es una función de densidad para la v.a.c. X, entonces:
I) f (x) 0 8x 2 R
R∞
II ) ∞
f (x)dx = 1
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Sea X una v.a.c. con función de densidad f (x) y a, b 2 R tal que a b.
Entonces la probabilidad de que X esté en [a, b] está dada por
Z b
P(a X b) = f (x)dx
a

D EFINITION
Si X es una v.a.c. con función de densidad f (x), entonces:
Z ∞
E(X ) = µ = xf (x)dx

y
V (X ) = σ 2 = E(X2 ) [E(X)]2
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Supón que X tiene la función de densidad

cx si 0 x 2
f (x) =
0 en otro caso

A) Encontrar el valor de c que hace que f (x) sea una


función de densidad
B) Graficar f (x)
C) Calcular P(1 X 2)
D) Utilizar la geometría de f (x) para calcular P(1 X 2)
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El tiempo requerido por los estudiantes para resolver un examen de
una hora es una variable aleatoria continua con una función de
densidad dada por:

cx2 + x si 0 x 1
f (x) =
0 en otro caso

A) Determinar el valor de c que hace que f (x) sea una


función de densidad.
B) Graficar f (x)
C) Calcular la probabilidad de que un estudiante termine el
examen en menos de media hora
D) Calcular la media y varianza del tiempo que requiere un
estudiante para resolver el examen
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
La proporción del tiempo, X, que un autómata industrial trabaja
durante una semana de 40 horas, es una variable aleatoria con la
siguiente función de densidad:

2x si 0 x 1
f (x) =
0 en otro caso

A) Calcular E(X) y V (X)


B) La ganancia semanal, G, para este autómata, está dada
por G = 200X 60. Determinar la media y varianza
para esta ganancia.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D ISTRIBUCIÓN UNIFORME

D EFINITION
Una v.a.c. X tiene una distribución de probabilidad uniforme si y
sólo si la función de densidad de X es:
1
si α1 x α2
f (x) = α2 α1
0 en otro caso

T HEOREM
Si X U (α1 , α2 ), entonces:

α1 + α2 ( α2 α1 )2
µ = E(X ) = & σ 2 = V (X ) =
2 12
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El tiempo de llegada de los clientes a cierta caja registradora tiene
una distribución uniforme. Se sabe que durante un periodo dado de
30 minutos, llegó un cliente a la caja.
A) Calcular la probabilidad de que un cliente haya llegado
durante los últimos 5 minutos del periodo, y últimos 10
minutos del periodo.
B) Encontrar la probabilidad de que un cliente haya
llegado durante los primeros 5 minutos del periodo, y
primeros 15 minutos.
C) Obtener la media y varianza del tiempo de llegada de
los clientes a la caja.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Si un paracaidista cae en un sitio aleatorio de la línea recta entre los
marcadores A y B,
A) Encontrar la probabilidad de que esté más cerca de A
que de B.
B) Calcular la probabilidad de que la distancia con respecto
a A sea más de tres veces la distancia con respecto a B.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El tiempo de un viaje (ida y vuelta) de los camiones que transportan
concreto hacia una obra de construcción en una carretera, está
distribuido uniformemente en un intervalo de 50 a 70 minutos.
A) ¿Cuál es la probabilidad de que la duración del viaje sea
mayor a 65 minutos si se sabe que la duración del viaje
es mayor a 55 minutos?.
B) Determinar la media y varianza de los tiempos de viaje
de los camiones.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El número de tarjetas de circuito impreso defectuosas que salen de
una máquina de soldadura, sigue una distribución uniforme. Se
encontró una tarjeta defectuosa durante una jornada específica de 8
horas de trabajo.
A) Hallar la probabilidad de que haya sido producida
durante la primera hora de operación de ese día.
B) Hallar la probabilidad de que haya sido producida
durante las dos últimas horas de ese día.
C) Obtener la probabilidad de que la tarjeta se haya
originado durante la quinta hora, dado que no se
produjeron tarjetas defectuosas en las primeras 4 horas
de operación.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D ISTRIBUCIÓN EXPONENCIAL

D EFINITION
Una v.a.c. X tiene una distribución de probabilidad exponencial, con
parámetro β, si y sólo si la función de densidad de X es:
( x
1
e β β > 0; x 0
f (x) = β
0 en otro caso

T HEOREM
Si X Exp( β), entonces:

µ = E(X ) = β & σ 2 = V (X ) = β2
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En una estación de bombeo se ha observado que la demanda de agua
durante las primeras horas de la tarde tiene aproximadamente una
ft3
distribución exponencial con una media de 100 s .
A) Calcular la probabilidad de que la demanda exceda los
ft3
200 s para un día seleccionado al azar.
B) ¿Cuál tendría que ser la capacidad de bombeo de la
estación a fin de que la demanda sea mayor a la
capacidad de bombeo con una probabilidad de 0.01?.

E XAMPLE
Si X Exp( β) y a, b 2 R+ , demostrar que

P(X > a + b j X > a) = P(X > b)


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D ISTRIBUCIÓN NORMAL ( GAUSSIANA )

D EFINITION
Una v.a.c. X tiene una distribución de probabilidad normal si y sólo
si la función de densidad de X es:
1 (x µ )2
f (x) = p e 2σ2 ; x, µ 2 R, σ > 0
σ 2π

T HEOREM
Si X N (γ, δ), entonces:

E(X ) = µ & V (X ) = σ 2

Notación: X N(µ, σ )
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Encontrar las siguientes probabilidades para una variable aleatoria
normal estándar Z:
A) P(0 Z 1.2)
B) P( 0.9 Z 0)
C) P(0.3 Z 1.56)
D) P( 0.2 Z 0.2)
E) P( 1.56 Z 0.2)
F) P(Z 2)
G) P( 2 Z 2)
H) P(0 Z 1.73)
I) P( 1 Z 2.04)
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Determinar el valor de z0 tal que:
A) P(Z > z0 ) = 0.5
B) P(Z < z0 ) = 0.8643
C) P( z0 < Z < z0 ) = 0.9
D) P( z0 < Z < z0 ) = 0.99

E XAMPLE
Los resultados de un examen de admisión en un colegio tienen una
distribución normal con media 75 y desviación estándar 10. ¿Qué
fracción de resultados queda entre 80 y 90?.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Se observó durante un largo periodo que la cantidad semanal
gastada en el mantenimiento y en las reparaciones en cierta fábrica
tiene aproximadamente una distribución normal con una media de
$400 y una desviación estándar de $20. Si el presupuesto para la
próxima semana es de $450,
A) ¿Cuál es la probabilidad de que los costos reales sean
mayores que la cantidad presupuestada?
B) ¿De cuánto tendría que ser el presupuesto para
reparaciones semanales y mantenimiento, para que la
cantidad presupuestada solamente se rebasara con una
probabilidad de 0.1?
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Se supone que los resultados de un examen tienen una distribución
normal con una media de 78 y una varianza de 36.
A) ¿Cuál es la probabilidad de que una persona que
presenta el examen obtenga calificación mayor que 72?
B) Suponga que a los estudiantes que se encuentran en el
10 % de la parte superior de la distribución se les asigna
una calificación A. ¿Cuál es la calificación mínima que
debe obtener un estudiante para tener una calificación
A.
C) ¿Cuál debe ser la mínima calificación aprobatoria si el
evaluador pretende que solamente el 28.1 % de los
estudiantes apruebe?
D) Si se sabe que la calificación de un estudiante es mayor
que 72, ¿cuál es la probabilidad de que su calificación
sea mayor que 84?
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

1. Estimación puntual
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E STIMACIÓN PUNTUAL

Abstract nonsense: A cada muestra de observaciones independientes,


se le asocia un único valor como aproximación del valor de un
determinado parámetro.

D EFINITION
Un estimador es una regla que establece cómo calcular una
estimación basada en las mediciones contenidas en una muestra.

E XAMPLE
Un posible estimador puntual para la media poblacional es... uno
para la varianza poblacional es...
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Propiedades de los estimadores:


Distribución centrada en el parámetro objetivo.
Varianza mínima.

D EFINITION
Sea b
θ un estimador puntual de un parámetro θ. Se dice que b
θ es un
estimador insesgado si
E(b
θ) = θ

Sesgo:
B(b
θ ) = E(b
θ) θ
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Estimadores puntuales insesgados comunes:

θ Muestra b
θ E(b
θ) V (b
θ)
σ2
µ n b=X
µ µ n
p(1 p)
p n p = Xn
b p n
σ21 σ22
µ1 µ2 n1 , n2 µ\
1 µ2 = X1 X2 µ1 µ2 n1 + n2
X1 X2 p1 (1 p1 ) p2 (1 p2 )
p1 p2 n1 , n2 p\
1 p2 = n1 n2 p1 p2 n1 + n2
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Si b
θ1 y b
θ 2 son dos estimadores insesgados para el parámetro θ, cuyas
varianzas son V (b θ 1 ) y V (b
θ 2 ), respectivamente; entonces la eficiencia
relativa de b θ 1 con respecto a b θ 2 se define como la razón

V (b
θ2 )
ER(b
θ1, b
θ2 ) =
b
V (θ 1 )

De donde, las posibilidades para ER:


I) ER(b
θ1, b
θ2 ) < 1
II ) ER(b
θ1, b
θ2 ) > 1
III ) ER(b
θ1, b
θ2 ) = 1
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Supón que X1 , X2 , X3 forman una muestra aleatoria de una
distribución cuya función de densidad es
1 x/θ
θe si x > 0, θ 6= 0
f (x) =
0 en otro caso

Considera los siguientes estimadores para θ:

b X1 + X2 b X1 + 2X2 b 3X1 + X3 b
θ 1 = X1 , b
θ2 = , θ3 = , θ4 = y θ5 = X
2 3 3

A) ¿Cuáles de ellos son insesgados?.


B) ¿Cuál es el de menor varianza? (eficiencia relativa).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Sea X1 , X2 , ..., Xn una muestra aleatoria de una población con
distribución uniforme en el intervalo (θ, θ + 1).
A) Demostrar que X es un estimador sesgado para el
parámetro θ y calcular su sesgo.
B) Obtener un estimador insesgado para θ.

E XAMPLE
Para X B(n, p), obtener un estimador insesgado b
p de p.

E XAMPLE
X +1
Sea X B(n, p). Determinar si el estimador b p= n+2 es insesgado
para p. En caso contrario, calcular su sesgo.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Supón que E(b
θ 1 ) = E(b
θ 2 ) = θ, V (b θ 1 ) = σ21 y V (b
θ 2 ) = σ22 . Se define un
nuevo estimador insesgado b θ 3 , por

b
θ 3 = ab
θ 1 + (1 a)b
θ2

Suponiendo que b θ1 y b
θ 2 son independientes, ¿cómo debe ser la
constante a para minimizar la varianza de bθ 3 ?.

E XAMPLE
Sea X1 , X2 , ..., Xn una muestra aleatoria (n > 3) de una distribución de
Poisson con parámetro λ. Si

b 1 = X1 + X2 + X4 y λ
λ b2 = X
3
son estimadores para λ, ¿cuál de éstos es mejor estimador para λ?.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Sea X B(n, p). Para estimar la varianza de X, se podría utilizar

[ X
V (X ) = 1 X
n

A) Demostrar que V [(X) es un estimador sesgado para


V (X) y calcular el sesgo.
B) Encontrar un estimardor insesgado para V (X) usando el
resultado de a).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Sea X1 , X2 , ..., Xn una muestra aleatoria de una población con
E(Xi ) = µ y V (Xi ) = σ2 , para i = 1, 2, ..., n. Considera los siguientes
estimadores para µ:

X1 + X2 X1 X2 + X3 + + Xn 1 Xn
µb1 = ; µb2 = + + ; µb3 = X
2 4 2(n 2) 4

A) Demostrar que cada uno de los tres estimadores es


insesgado.
B) ¿Cuál de ellos es de menor varianza? (eficiencia
relativa).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Sea X1 , X2 , ..., Xn una muestra aleatoria de una población con
E(Xi ) = µ y V (Xi ) = σ2 , para i = 1, 2, ..., n.
A) Demostrar que

1 n
σb21 = ∑ (Xi X )2
n i=1

es un estimador sesgado para σ2 .


B) A partir de lo anterior, encontrar un estimador
insesgado para σ2 .
n n 2
Sugerencia: Primero demostrar y emplear ∑ (Xi X)2 = ∑ Xi2 nX .
i=1 i=1
Después usar el hecho que V (X) = E X2 µ2 .
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

2. Intervalos de confianza
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

I NTERVALOS DE CONFIANZA

Abstract nonsense: Encontrar un intervalo que contenga al parámetro


objetivo con una probabilidad dada.

Para muestras grandes:

Si b
θ es un estimador para θ tal que b
θ N (θ, σbθ ), entonces:
h i
θ2 bθ σbθ zα/2 , b
θ + σbθ zα/2

con probabilidad 1 α.

* Aquí, zα/2 es tal que P (Z zα/2 ) = α/2.


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Se registraron los tiempos utilizados en la compra para 64 clientes
seleccionados al azar en el supermercado local. La media y varianza
de los 64 tiempos de compra fueron 33 minutos y 256,
respectivamente. Estimar el promedio real, µ, del tiempo utilizado
por clientes en la compra, con una probabilidad de 0.9.

E XAMPLE
Una encuesta realizada con respecto a la política de jubilaciones
reveló que una alta proporción de estadounidenses es muy pesimista
con respecto a sus perspectivas cuando lleguen a jubilarse. Al
preguntarles si consideran que su jubilación será suficiente, 62.9 % de
los 6, 100 entrevistados, trabajadores de tiempo completo de 18 años
o más, indicaron que su ingreso al jubilarse definitivamente no sería
suficiente. Calcular un intervalo de confianza de 95 % para la
proporción de todos los trabajadores de 18 años o más que
consideran que al jubilarse su ingreso por pensión no sería suficiente.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Una encuesta se basó en entrevistas por teléfono de 8, 497 adultos
residentes en Florida seleccionados al azar. Al preguntárseles si
consideraban decisivo el sexo de un candidato político, el 62 % de los
hombres y el 49 % de las mujeres opinaron que el sexo del candidato
no importaba. Si se entrevistaron 241 hombres y 256 mujeres,
construir un intervalo de confianza de 98 % para la diferencia entre
las proporciones de hombres y mujeres en Florida para los cuales el
sexo del candidato no tendría importancia.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El Florida Alligator reportó que “los estudiantes de derecho se oponen
a la pena de muerte”. Se hizo esta declaración con base en una
encuesta para la cual se escogieron al azar y entrevistaron a 86
estudiantes de derecho. El 52 % de los entrevistados declararon que
se oponían a la pena de muerte. A partir de esta información, obtener
un intervalo de confianza de 90 % para la proporción real de
estudiantes de derecho que se oponen a la pena de muerte.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Dos marcas de refrigeradores, A y B, tienen una garantía de un año.
En una muestra aleatoria de 50 refrigeradores de la marca A, 12 se
descompusieron antes de terminar el periodo de garantía. Una
muestra aleatoria de 60 refrigeradores de la marca B reveló también
12 descomposturas durante el periodo de garantía. Estimar la
diferencia real entre las proporciones de fallas, durante el periodo de
garantía, mediante un intervalo de confianza con probabilidad de
0.98.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Según el Environment News, la “lluvia ácida” causada por la reacción
de ciertos contaminantes en el aire con el agua de la lluvia parece ser
un problema creciente en la parte noroeste de Estados Unidos (la
lluvia ácida afecta el suelo y corroe las superficies metálicas
expuestas). La lluvia pura que se precipita a través del aire limpio
tiene un pH de 5.7. Supóngase que se analizan muestras de agua de
40 lluvias con respecto a su pH y que tiene media y desviación
estándar de 3.7 y 0.5, respectivamente. Determinar un intervalo de
confianza de 95 % para la media de los pH en las lluvias.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Se considera esencial para una buena salud una pequeña cantidad
del oligoelemento selenio, de 50 a 200 microgramos al día. Supóngase
que se seleccionaron muestras aleatorias de 30 adultos de dos
regiones de Estados Unidos, y que se registró para cada persona el
consumo de selenio, mediante líquidos y sólidos, en un día. La media
y desviación estándar de los consumos diarios de selenio para los 30
adultos de la región I eran 167.1 y 24.3 microgramos,
respectivamente. Las estadísticas correspondientes para los 30
adultos de la región II eran 140.9 y 17.6 (media y desviación
estándar), respectivamente. Obtener un intervalo de confianza de
96 % para la diferencia en el promedio del consumo de selenio en las
dos regiones.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Para muestras pequeñas:

Distribución chi cuadrada: Inferencia con respecto a la varianza


de una población normal.

Distribución t student: Inferencia sobre la media (o diferencia


de medias) de una población normal.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Sea v 2 Z+ . Se dice que una v.a. X tiene una distribución
chi-cuadrada con v grados de libertad (X χ2 (v)) si y sólo si la
función de densidad de X es
( v 1 x
x2 e 2
2v/2 Γ(v/2)
si x 0
f (x) =
0 en otro caso

donde, Z ∞
v
Γ(v/2) = x2 1
e x
dx
0
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

T HEOREM
Sea fXi gni=1 una muestra aleatoria tal que 8i, Xi N (µ, σ). Entonces 8i,
X µ
Zi = iσ N (0, 1) son independientes y
n
∑ Z2i χ2 (n)
i=1

D EFINITION
Si Z N (0, 1) y χ2 χ2 (v), entonces

Z
T= p
χ2 /v

se dice que tiene una distribución t-student con v grados de libertad


(T T (v)).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Así, los intervalos de confianza resultan:

Para µ:
Stα/2
X p
n
donde tα/2 es tal que P(T tα/2 ) = α/2 con n 1 g.l.

Para µ1 µ2 : s
1 1
X1 X2 tα/2 Sc +
n1 n2
donde
( n1 1)S21 + (n2 1)S22
S2c =
n1 + n2 2
y tα/2 es tal que P(T tα/2 ) = α/2 con (n1 + n2 2) g.l.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Mientras que,

Para σ2 : " #
(n 1)S2 (n 1)S2
,
χ2α/2 χ21 α/2

donde χ2α/2 es tal que P χ2 χ2α/2 = α/2 con n 1 g.l.


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Los resultados de una muestra aleatoria de 16 personas que
presentaron el GRE tuvieron una media de 540 y una desviación
estándar de 50. Obtener un intervalo de confianza de 95 % para la
media poblacional de los resultados del GRE, suponiendo que éstos
tienen una distribución normal.

E XAMPLE
Las edades de cinco profesores universitarios en una muestra
aleatoria son 39, 54, 61, 72 y 59 años. Obtener un intervalo de
confianza de 99 %, a partir de estos datos, para la varianza
poblacional de las edades de todos los profesores de la universidad,
suponiendo que las edades se distribuyen normalmente.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Se administraron dos nuevos medicamentos a pacientes con un
padecimiento cardiaco. El primer medicamento bajó la presión
sanguínea de 16 pacientes en un promedio de 11 puntos, con una
desviación estándar de 6 puntos. El segundo medicamento bajó la
presión sanguínea de otros 20 pacientes en un promedio de 12
puntos, con una desviación estándar de 8 puntos. Determinar un
intervalo de confianza del 95 % para la diferencia en la reducción
media de la presión sanguínea, al suponer que las mediciones tienen
distribuciones normales.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En el trabajo de un laboratorio es deseable verificar cuidadosamente
la variabilidad de las lecturas obtenidas de muestras estándar. En un
estudio de la concentración de calcio en agua potable como parte de
la valoración de la calidad del agua, se pasó el mismo patrón de
medida seis veces por el laboratorio en intervalos aleatorios. Las
lecturas, en partes por millón, fueron 9.54, 9.61, 9.32, 9.48, 9.70 y 9.26.
Estimar la varianza de la población para las lecturas obtenidas del
patrón, con un intervalo de confianza del 90 %.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
La Agencia para la Protección ambiental reunió información con
respecto a mediciones de CL50 (concentración letal que mata a 50 %
de los animales de experimentación) para ciertos productos químicos
que se pueden encontrar probablemente en ríos y lagos de agua
dulce. Para cierta especie de peces, las mediciones de CL50 en 12
experimentos fueron las siguientes:

16, 5, 21, 19, 10, 5, 8, 2, 7, 2, 4, 9

(las mediciones se indican en partes por millón). Estimar el


verdadero promedio de CL50, con un coeficiente de confianza de 0.9,
suponiendo que las mediciones de CL50 tienen aproximadamente
una distribución normal.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Un instrumento de precisión tiene como garantía el leer con un error
máximo de 2 unidades. Una muestra de cuatro lecturas del mismo
objeto dio como mediciones 353, 351, 351 y 355. Calcular un intervalo
de confianza de 90 % para la varianza de la población.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Sean χ21 χ2 (v1 ) y χ22 χ2 (v2 ), entonces

χ21 /v1
F=
χ22 /v2

se dice que tiene una distribución F Fisher con v1 g.l. en el


numerador y v2 g.l. en el denominador.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

3. Prueba de hipótesis
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

P RUEBA DE HIPÓTESIS

Abstract nonsense: Verificar una hipótesis con respecto a los valores de


uno o más parámetros poblacionales.

Elementos de una prueba estadística:


Hipótesis alternativa (Ha)
Hipótesis nula (Ho)
Estadístico de prueba
Región de rechazo
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

PARA MUESTRAS GRANDES

Ha : θ > θ0 θ < θ0 θ 6= θ 0
Ho : θ θ0 θ θ0 θ = θ0

b
θ θ0
Estadı́stico Z= σbθ

RR = f z > zα g fz < zα g fjzj > zα/2 g


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Errores en las pruebas

Se comete un error tipo I si Ho es rechazada cuando Ho es


verdadera.
Se comete un error tipo II si Ho es aceptada cuando Ha es
verdadera.

Niveles de significancia alcanzados

D EFINITION
Para un estadístico de prueba, el nivel de significancia alcanzado (o
valor p) es el nivel más pequeño de significancia α para el cual la
información observada indica que la hipótesis nula debe ser
rechazada.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Los salarios diarios en una industria en particular presentan una
distribución normal con una media de $13.2 USD y una desviación
estándar de $2.5. Si en esta industria una compañía que emplea a 40
trabajadores les paga en promedio $12.2, ¿puede acusarse a esta
compañía de pagar salarios inferiores?. Utilizar un nivel de
significancia de 0.01. Determinar el valor p para el estadístico de
prueba.

E XAMPLE
Se tiene que reparar una máquina en cierta fábrica si produce más de
10 % de artículos defectuosos del gran lote de producción de un día.
Una muestra aleatoria de 100 artículos de la producción diaria
contiene 15 defectuosos, y el encargado decide que debe repararse la
máquina. ¿La evidencia de la muestra apoya su decisión?. Utilizar un
nivel de significancia de 0.02.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Un investigador político afirma que la fracción de republicanos es
mayor que la fracción de demócratas en favor de la pena de muerte.
Obtuvo muestras aleatorias de 200 republicanos y 200 demócratas, y
encontró que 46 republicanos y 34 demócratas estuvieron a favor de
la pena de muerte. ¿Fundamenta esta evidencia un apoyo estadístico
para la opinión del investigador?. Realizar la prueba con un nivel de
significancia de 0.05.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Un economista al servicio de una agencia estatal desea realizar
inferencia sobre la fracción de desempleados en dos grandes áreas
urbanas del estado. Con base en muestras aleatorias de cada ciudad,
cada una de 500 personas, el economista encuentra 35 personas
desempleadas en un área y 25 en la otra. A un nivel de significancia
de 0.05, ¿se puede deducir que las frecuencias de desempleo en las
dos áreas son diferentes?. Determinar el valor p para el estadístico de
prueba.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En una encuesta de Business Week se pidió a los ejecutivos de
empresas grandes su opinión acerca de sus perspectivas económicas
para el futuro. Una de las preguntas era: ¿piensa usted que en los
próximos 12 meses aumentará en su empresa el número de
empleados de tiempo completo?. En esa encuesta, 220 de 400
respondieron sí, mientras que en la encuesta realizada el año anterior,
192 de 400 respondieron sí. ¿Se puede concluir que hay diferencia
significativa entre las proporciones en estas dos encuestas?. Realizar
una prueba con nivel de significancia de 0.02.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El departamento de estadística de una universidad nunca ha tenido
menos del 11 % de reprobados en su curso introductorio; durante un
semestre experimental a todos los estudiantes inscritos en dicho
curso se les pidió asistir una hora de laboratorio además de sus
clases, con la esperanza de disminuir la reprobación; al final del
semestre, reprobaron 171 estudiantes de entre 1800. ¿Puede
afirmarse, a un nivel de significancia de 0.05, que ha disminuido la
proporción de reprobados debido al uso del laboratorio?. Encontrar
el valor p para el estadístico de prueba.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En una encuesta llevada a cabo en determinado estado de U.S.A., se
entrevistó a 871 adultos. Con respecto a una pregunta, 53 % de los
entrevistados estuvieron a favor de un apoyo decidido para Israel.
¿Se podría concluir que la mayoría de adultos en ese estado está a
favor de un apoyo decidido para Israel?. Usar un nivel de
significancia de 5 %.

E XAMPLE
Un fabricante de lavadoras automáticas produce un modelo
particular en tres colores A, B o C. De las primeras 1000 lavadoras
vendidas, se nota que 400 eran de color A. ¿Podríamos concluir que
los clientes tienen una preferencia para el color A?. Justificar
respuesta usando un nivel de significancia de 0.02.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Muchas personas en Gran Bretaña creen aún que "la letra con sangre
entra". Se realizó una encuesta nacional; de 604 padres entrevistados,
63 % estaba a favor del castigo corporal en las escuelas.
¿Proporcionan estos datos suficiente evidencia que indique que la
mayoría de la población de la Gran Bretaña está a favor de sanciones
corporales en las escuelas?. Realizar la prueba con un nivel de
significancia de 0.01. Determinar el valor p para el estadístico de
prueba.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

PARA MUESTRAS PEQUEÑAS

Prueba para µ:

Ha : µ > µ0 µ < µ0 µ 6 = µ0
Ho : µ µ0 µ µ0 µ = µ0
p
n (X µ0 )
Estadı́stico T= S

RR = f t > tα g ft < tα g fjtj > tα/2 g

Aquí, T T (n 1).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Prueba para µ1 µ2 :

Ha : µ1 µ2 > µ0 µ1 µ2 < µ0 µ1 µ2 6 = µ0
Ho : µ1 µ2 µ0 µ1 µ2 µ0 µ1 µ2 = µ0

X1 X2 µ0
Estadı́stico T= q
1 1
Sc n +n
1 2

RR = f t > tα g ft < tα g fjtj > tα/2 g

Donde T T (n1 + n2 2) y

(n1 1)S21 + (n2 1)S22


S2c =
n1 + n2 2
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Prueba para σ2 :

Ha : σ2 > ω 0 σ2 < ω 0 σ2 6 = ω 0
Ho : σ2 ω 0 σ2 ω 0 σ2 = ω 0

(n 1)S2
Estadı́stico χ2 = ω0
n o
RR = x > χ2α x < χ21 α χ2α/2 < x < χ21 α/2

Aquí, χ2 χ2 (n 1).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Prueba para σ21 σ22 :

Ha : σ21 σ22 > 0 σ21 σ22 < 0


Ho : σ21 σ22 0 σ21 σ22 0

S21
Estadı́stico F= S22

n o
1
RR = fx > Fn1 1;n2 1;α g x < (Fn2 1;n1 1;α )

Ha : σ21 σ22 6= 0
Ho : σ21 σ22 = 0

S21
Estadı́stico F= S22

n o
1
RR = Fn1 1;n2 1;α/2 < x < (Fn2 1;n1 1;α/2 )
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Anteriormente una industria había producido un promedio de 1100
libras de determinado producto por día. Los registros para el mes
pasado, basados en 26 días de trabajo, mostraron una media y
desviación estándar de 1060 y 340 libras por día, respectivamente.
¿Indican estos datos que hay una declinación en la producción diaria
promedio, a un nivel de significancia de 2.5 %?.

E XAMPLE
Un investigador está convencido de que su equipo de medición tiene
una variabilidad que se traduce en una desviación estándar de 2. 16
mediciones dieron como resultado una varianza de 6.1. ¿Están los
datos en desacuerdo con su afirmación?. Emplear un nivel de
significancia de 0.05.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Fidelity Magellan (FM) es un fondo mutualista de capital grande y
Fidelity Small Cap Stock (FSCS) es un fondo mutualista de capital
pequeño. La desviación estándar muestral de ambos fondos se
calculó empleando muestras aleatorias de tamaño 25. La desviación
estándar muestral de FM fue 8.89 % y la de FSCS fue 13.03 %. Los
analistas financieros suelen usar la desviación estándar como una
medida del riesgo. Determinar si los fondos de capital pequeño son
más riesgosos que los fondos de capital grande, a un nivel de
significancia de 5 %.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Merrill Lynch solicita periódicamente a sus clientes evaluaciones sobre
la asesoría financiera y los servicios que les presta. Puntuaciones más
altas indican mejor servicio, 7 es la puntuación más alta. Hay interés
por puntuaciones para dos consultores financieros; el consultor A
tiene 10 años de experiencia y el consultor B tiene 1 año de
experiencia. 16 miembros evaluaron al consultor A con una
calificación media de 6.82 y desviación estándar de 0.64, mientras que
10 miembros dieron al consultor B una calificación media de 6.25 y
desviación estándar de 0.75. A un nivel de significancia de 1 %,
realizar una prueba para determinar si el consultor que tiene más
años de experiencia obtuvo una puntuación más alta que el de menos
experiencia. Determinar el valor p para el estadístico de prueba.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Las tasas de interés en hipotecas para vivienda a 30 años con plazos
fijos varían en México. En el verano de 2010, los datos de varias
partes del país indicaban que la desviación estándar de las tasas de
interés era 0.096. En un estudio realizado en 2014, las tasas de interés
en préstamos a 30 años con plazo fijo en una muestra de 20
instituciones de préstamo mostraron una desviación estándar de
0.114. Determinar si los datos muestrales indican que la variabilidad
en las tasas de interés ha cambiado, a un nivel de significancia de 0.1.
Determinar el valor p para el estadístico de prueba.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Se registraron los precios, al cierre de las operaciones, de dos acciones
durante un periodo de 16 y 13 días, respectivamente. Las medias y
varianzas fueron:

Media Varianza
Acción I 40.33 1.54
Acción II 42.54 2.96

¿Presentan estos datos suficiente evidencia para indicar una


diferencia en variabilidad para los precios al cierre de las
operaciones, de las dos acciones para las poblaciones asociadas con
las dos muestras?. Emplear un nivel de significancia de 2 %.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
En una empresa se requiere aproximadamente un periodo de
entrenamiento de un mes para que un nuevo empleado alcance la
máxima eficiencia. Se sugirió un nuevo método para el entrenamiento
y se realizó una prueba para comparar el método nuevo con el
procedimiento estándar. Se entrenaron dos grupos de nueve
empleados nuevos; un grupo utilizó el nuevo método y el otro grupo
el procedimiento de entrenamiento estándar. Se midió el tiempo (en
minutos) que necesitó cada empleado para realizar una determinada
actividad. Las mediciones se muestran en la siguiente tabla:

Procedimiento Mediciones
Estándar 32 37 35 28 41 44 35 31 34
Nuevo 35 31 29 25 34 40 27 32 31

¿Hay suficiente evidencia para indicar una diferencia en los


promedios de los tiempos reales para los dos métodos?. Realizar la
prueba con un nivel de significancia de 5 %.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
El Instituto Eléctrico Edison publica cifras del número anual de
kilowatt-hora que gastan varios aparatos eléctrodomésticos. Se
reportó que una aspiradora gasta un promedio mínimo de 46
kilowatt-hora al año. Si una muestra aleatoria de 12 hogares que se
incluye en un estudio planeado, indica que las aspiradoras gastan un
promedio de 42 kilowatt-hora al año con una desviación estándar de
11.9 kilowatt-hora, ¿esto sugiere con un nivel de significancia de 0.05
que las aspiradoras gastan, en promedio, menos de 46 kilowatt-hora
anualmente?.

E XAMPLE
Se afirma que un instrumento de medición es exacto con una
variabilidad no mayor a 5 unidades. Una muestra de cuatro lecturas
del instrumento dio como mediciones 353, 351, 351 y 355. ¿Realmente
se puede apoyar a un nivel de significancia de 2.5 %, la afirmación
con respecto a la variabilidad?.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Un experimento para estudiar los umbrales del dolor producido por
descargas eléctricas en hombres y mujeres reveló los datos de la
siguiente tabla:

Hombres Mujeres
No. de mediciones 16 10
Varianza 12.7 16.4

¿Muestran los datos evidencia suficiente para afirmar que la


variabilidad de los umbrales del dolor para hombres es menor que la
de las mujeres, a un nivel de significancia de 10 %?.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

4. Modelos lineales
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

M ÍNIMOS CUADRADOS ORDINARIOS (MCO)

Abstract nonsense:

Modelación (probabilística) de una respuesta que sea función de una


o más variables independientes.

y = f x(1) , x(2) , ..., x(k)


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
Un modelo estadístico lineal que relaciona una respuesta aleatoria y
n ok
con un conjunto de variables independientes x(i) es de la forma
i=1

y = β 0 + β 1 x(1) + β 2 x(2) + + β k x(k ) + ε (1)

donde ε es una v.a. tal que

E( ε ) = 0 y V ( ε ) = σ2

f βi gki=0 es un conjunto de parámetros desconocidos.


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

En general, serán modelos lineales de las β0 s!


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Así, del modelo (1) se tiene:

E ( y ) = β 0 + β 1 x(1) + β 2 x(2) + + β k x(k )

Si k = 1: Modelo de regresión lineal simple


Si k > 1: Modelo de regresión lineal múltiple

R EMARK
El modelo estadístico lineal tiene una componente determinística (E(y)) y
una aleatoria (ε).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

M ÍNIMOS CUADRADOS ORDINARIOS ( REGRESIÓN


SIMPLE )

Se desea ajustar el modelo

E(y) = β0 + β1 x

Si b
β0 y b
β1 son estimadores de los parámetros β0 y β1 , entonces

y=b
b β0 + b
β1 x

será un estimador para E(y).

Entonces, ¿cómo obtener estimadores para β0 y β1 ?...


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Se propone definir
n
SCR(b
β0 , b
β1 ) = ∑ ( yi yi ) 2
b
i=1

De donde,
b n ∑ni=1 xi yi ∑ni=1 xi ∑ni=1 yi
β1 = 2
n ∑ni=1 x2i (∑ni=1 xi )
y
b
β0 = y b
β1 x
Son tales que minimizan SCR.
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

S UPUESTOS DE MCO
I) El modelo de regresión es lineal en los parámetros β0 y
β1 : y = β0 + β1 x

II ) La variable explicativa x es no estocástica

III ) E( εi ) = 0 8i

IV ) V (εi ) = σ2 8i (homoscedasticidad)

V) Cov(εi , εj ) = 0 8i 6= j

VI ) Cov(εi , xi ) = 0 8i

VII ) n>k

VIII ) εi N (0, σ) 8i
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Una empresa quiere estudiar la rentabilidad de su inversión en
publicidad. Para ello ha recopilado datos de ganancias de ventas y
del gasto en publicidad de 10 años:

Año Ventas (mdd) Gasto en publicidad (mdd)


2007 2.3 0.46
2008 4.6 0.69
2009 6.9 0.82
2010 9.2 0.92
2011 9.2 1.1
2012 13.8 1.6
2013 18.4 2.3
2014 23 2.5
2015 29.9 2.7
2016 32.2 2.9

Estimar el modelo de regresión lineal que explique estas ventas.


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Es generalmente aceptado que, si se incrementa el número de
unidades producidas, se puede habitualmente disminuir su costo por
unidad. Los siguientes datos relacionan los costos unitarios de
producción con el número de unidades producidas:

Número de unidades 10 20 50 100 150 200


Costo por unidad 11.3 9.2 9.1 8.7 8.2 6.4
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

E XAMPLE
Hay datos salariales anuales para una muestra de 10 vicepresidentes
de ventas, así como de sus bonos anuales. Los datos se dan en miles
de dólares:
Salario Gratificación
135 10.3
115 16.2
146 14.7
167 17.8
165 26.4
176 22.4
98 8.1
136 17
163 16.9
119 9.7
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

P ROPIEDADES DE LOS ESTIMADORES DE MCO

b
β0 y b
β1 son insesgados:

E b
β0 = β0 y E b
β1 = β1

Los estimadores b
β0 y b
β1 tienen varianza mínima

Un estimador (insesgado) para V (ε) = σ2 :

SCR
σb2 =
n 2
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Varianzas:

σ2 σ2 ∑ni=1 x2i
V b
β1 = n ; V b
β0 =
∑i=1 (xi x)2 n ∑ni=1 (xi x)2

Covarianza entre estimadores:

Cov b
β0 , b
β1 = xV b
β1
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

A JUSTE MEDIANTE MATRICES

Para n obervaciones de un modelo lineal simple de la forma


y=b
b β0 + b
β1 x, definimos:
2 3 2 3
y1 1 x1 " #
6 y2 7 6 1 x2 7 b
6 7 6 7 b β0
Y=6 .. 7; X=6 .. .. 7 ; β= b
4 . 5 4 . . 5 β1
yn 1 xn

Así, las ecuaciones de MCO están dadas por:

XT X b
β = XT Y
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Donde,
n ∑ni=1 xi
XT X =
∑ni=1 xi ∑ni=1 x2i

y
∑ni=1 yi
XT Y =
∑ni=1 xi yi

Finalmente,
1
b
β = XT X XT Y
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

C ORRELACIÓN LINEAL

¿Cómo determinar si dos variables aleatorias están relacionadas


linealmente?...
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

D EFINITION
La correlación entre dos variables aleatorias X y Y se define como

n ∑ni=1 xi yi ∑ni=1 xi ∑ni=1 yi cov(X, Y)


rX Y =q q =
(∑ni=1 xi )2 n ∑ni=1 y2i (∑ni=1 yi )2
σX σY
n ∑ni=1 x2i

Además,
1 rX Y 1
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

C OEFICIENTE DE DETERMINACIÓN :

Sean
n
SCT = ∑ (yi y)2
i=1
n 2 n
SCE = ∑ b
yi b
y = ∑ (byi y)2
i=1 i=1
n
SCR = ∑ ( yi yi ) 2
b
i=1

Así, la proporción de la variación total en y explicada por el modelo


de regresión o por la variable explicativa x es:

SCE SCR
R2 = =1 = r2X Y
SCT SCT
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

P RUEBA T ( DE SIGNIFICANCIA )

Significancia de β0 :

Ha : β0 6 = 0

Ho : β0 = 0

b
β0
Estadı́stico T= σ bβ
0

RR = fjtj > tα/2 g

De donde, T T (n 2).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

Significancia de β1 (y en consecuencia, de x):

Ha : β1 6 = 0

Ho : β1 = 0

b
β1
Estadı́stico T= σ bβ
1

RR = fjtj > tα/2 g

De donde, T T (n 2).
O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

I NTERVALOS DE CONFIANZA

Intervalo de confianza al 100(1 α) % para βj :

b
βj tα/2 σ bβ
j

Aquí, tα/2 se obtiene de una distribución T T (n 2).


O UTLINE P RELIMINARES E STIMACIÓN PUNTUAL I NTERVALOS DE CONFIANZA P RUEBA DE HIPÓTESIS M ODELOS LINEALES

THE END...

...(is near)