Академический Документы
Профессиональный Документы
Культура Документы
INTENCIONALIDAD
ŷi = a + b ∗ x
donde
a representa el intercepto de la recta con el eje y.
b representa la pendiente de la recta de regresión lineal.
Supuestos de la inferencia para la regresión
Para una muestra aleatoria simple de n observaciones de una variable explicativa x y una
variables respuesta y. Se tiene como objeto predecir el comportamiento de la variable y para
determinados valores de la variable x.
Para cualquier valor de x la respuesta y tiene una distribución normal. Las respuestas
repetidas de y son independientes (observaciones independientes).
2
donde tα/2 es el valor critico de área superior α/2 de la distribución t con (n-2) grados de
libertad. y
s
pPn
2
i=1 (xi − x̄)
es el error estandar de la pendiente b
Prueba de hipótesis para una relación no lineal
Las pruebas de hipótesis para la pendiente de la recta de regresión más usadas son:
H0 : β = 0 H0 : β = 0 H0 : β = 0
Ha : β < 0 Ha : β > 0 Ha : β 6= 0
Estadı́stico de prueba para la prueba de hipótesis acerca β
b
t= s
pPn
2
i=1 (xi − x̄)
Esta prueba es equivalente a probar que la correlación es cero.
Inferencia para la predicción
3
Cuando ajustamos una recta de regresión con los datos el objetivo es predecir el valor de la
variable respuesta determinada por un valor especifico de la variable explicativa.
Usamos la recta de regresión con uno de los siguientes propósitos:
Estimar el valor promedio de y para un valor especifico dado de x.
Predecir un valor particular de y para un valor especifico dado de x.
Intervalos de confianza y de predicción para la regresión.
Intervalo de confianza para estimar el valor promedio de y cuando x = x0 .
s
1 (x0 − x̄)2
ŷ ± tα/2 s + Pn 2
n i=1 (xi − x̄)
donde tα/2 es el valor critico de área superior α/2 de la distribución t con (n-2) grados de
libertad.
Observación: Los programas estadı́sticos generalmente dan las estimaciones, errores
estándar de los estadı́sticos, valores t calculados y el valor P de dos colas, por tanto no es
necesario hacer estos cálculos. Para una prueba de una cola el valor P se divide entre dos
EJEMPLOS
Ejemplo 1.
Se muestra en la tabla las puntuaciones de aprovechamiento en matemáticas para una mues-
tra aleatoria de 10 estudiantes universitarios de primer año, junto con sus calificaciones
finales de calculo.
Estudiante 1 2 3 4 5 6 7 8 9 10
Puntuación Examen
Aprovechamiento 39 43 21 64 57 47 28 75 34 52
Calificación
Final 65 78 52 82 92 89 73 98 56 75
Solución:
Con el programa R nos proporciona la salida de los resultados de nuestro problema para
responder las preguntas
1. Diagrama de dispersión
Se observa una relación lineal positiva moderada entre la puntuación de aprovecha-
miento en matemáticas y la calificación final de calculo.
5
4. la pendiente de la recta de regresión nos indica que por cada punto que aumente la
puntuación en aprovechamiento en matemáticas la calificación final de calculo se espera
que aumente en promedio 0.7656 puntos.
El intervalo de confianza de de 90 % para la pendiente es 0.362 a 1.169. Como el
intervalo no contiene a cero, se concluye que el verdadero valor de β no es cero y
rechaza la hipótesis nula H0 : β = 0 en contraste de Ha : β 6= 0
5. La estimación puntual promedio de la calificación final de calculo, para estudiantes con
un puntaje de aprovechamiento en matemáticas de 52 es
EJERCICIOS PROPUESTOS
Para resolver cada uno de los problemas haga uso del programa R (o R studio).
1. Los manatı́s son unas criaturas marinas grandes y apacibles que viven a lo largo de
la costa de Florida. Las lanchas motoras matan o lastiman muchos de estos animales.
He aquı́ datos sobre las lanchas motoras registradas (en miles) y el número de manatı́s
muertos por las lanchas en Florida entre los años 1977 y 1990.
Tocones 2 2 1 3 3 4 3 1 2 5 1 3
Larvas 10 30 12 24 36 40 43 11 27 56 18 40
Tocones 2 1 2 2 1 1 4 1 2 1 4
Larvas 25 8 21 14 16 6 54 9 13 14 50
¿tener una valor extremo es sorprendente para una distribución normal? Justifica
tu respuesta.
f ) Representa los valores residuales en relación con la variable explicativa. La distri-
bución de los residuos, ¿presenta alguna anomalı́a?
3. Una empresa recoge datos sobre la tasa de desocupación en edificios de oficinas y las
tasas de las rentas en mercados de Estados Unidos. Los datos siguientes dan la tasa de
desocupación ( %) y las tasas de rentas promedio en dolares (por pie cuadrado) en las
zonas comerciales centrales de 18 mercados
T. desocupación 21.9 6.0 22.8 18.1 1.7 14.5 20.0 19.2 16.0
T. promedio 18.54 33.70 19.67 21.01 35.09 19.41 25.28 17.02 24.04
T. desocupación 6.6 15.9 9.2 19.7 20.0 8.3 17.1 10.8 11.1
T. promedio 31.42 18.74 26.76 27.72 18.20 25.00 29.78 37.03 28.64
USANDO R
BIBLIOGRAFÍA
1. Moore, David S. The Basic Practice of Statistics. Fifth Edition. New York WH Freeman
and Company (2010).
2. Triola Mario F. ESTADISTICA. Decimoprimera Edición. Pearson Educación 2013.
3. Devore Jay l. PROBABILIDAD Y ESTADÍSTICA para ingenierı́a y ciencias. Octava
edición . Cengage Learnig 2010
4. Canavos George C. PROBABILIDAD Y ESTADÍSTICA, Aplicaciones y Métodos. Pri-
mera edición en español, Mc Graw Hill 1987.
5. Levin Richard I. y Rubı́n David S. ESTADÍSTICA para ADMINISTRADORES. Sexta
edición, Prentice Hall.
6. Anderson David R. Sweeney Dennis J. Williams Thomas A. ESTADÍSTICA PARA
ADMINISTRACION Y ECONOMIA. Décima edición, Cengage Learnig.
7. Paul Newold, William L. Carlson y Betty Thorne. Estadı́stica para administración y
economı́a. Sexta edición. Prencice Hall.