Академический Документы
Профессиональный Документы
Культура Документы
INFERENCIAL
Semana 14 - Sesión 01
LOGRO DE LA SESIÓN
Interpretación: Si r = 1, se dice que hay una correlación perfecta positiva. Si r = −1, se dice que
hay una correlación perfecta negativa. Si r = 0, se dice que no hay correlación lineal entre las
dos variables.
Estimación del modelo de regresión lineal
Dado (𝑥1 , 𝑦1 ), (𝑥2 , 𝑦2 ),··· , (𝑥𝑛 , 𝑦𝑛 ), una muestra de tamaño n de una variable bidimensional (X,Y ), el
modelo de regresión lineal simple de Y (variable dependiente) con respecto de X (variable independiente),
consiste en determinar la ecuación de la recta:
𝑌 = 𝑎 + 𝑏𝑋
que mejor se ajuste a los datos de la muestra, con el fin de predecir o estimar Y a partir de X. El valor 𝑦
denominado valor estimado o predecido, representa un valor de Y calculado de la ecuación Y = a +bX
cuando X = 𝑥𝑖 . Para determinar dicha ecuación de regresión utilizaremos el método de mínimos
cuadrados.
Método de mínimos cuadrados
Cuando se considera la ecuación de regresión lineal muestral, cada dato (𝑥𝑖 , 𝑦𝑖 ) de la muestra, satisface
la ecuación:
en donde 𝑒𝑖 = 𝑦𝑖 -𝑦𝑖 se denomina error o residuo y describe el error en el ajuste del modelo de regresión
muestral en el punto i de los datos. Consideremos la suma de cuadrados de errores:
Determinar una recta de regresión de mínimos cuadrados consiste en hallar los valores de a y b de tal
manera que SCE sea mínimo. Derivando SCE con respecto a a y con respecto a b y luego igualando a
cero se obtiene las siguientes ecuaciones:
Resolviendo el sistema de ecuaciones se obtiene:
es equivalente a:
Interpretación:
Si b > 0, entonces, la tendencia lineal es creciente, es decir, a mayores valores de X se tiene
mayores valores de Y .
Si b < 0, entonces, la tendencia lineal es decreciente, es decir, a mayores valores de X se tiene
menores valores de Y .
Si b = 0, se dice que no hay regresión muestral.
Coeficiente de determinación
El coeficiente de determinación mide el porcentaje de variación en la variable respuesta, explicada por
la variable independiente, es denotada por 𝑟 2 y se define por:
es equivalente a:
son respectivamente
d. Si el gasto anual en mantenimiento para una de estas máquinas fue de cinco mil dólares, ¿cuántas horas a la
semana se usó la máquina?
𝑌 = 10.528 + 0.9534 𝑋
50=10.528+0.9534 𝑋
𝑋= 41.4013 horas de uso
e. Determine e interprete el coeficiente de correlación.
R= 0.9253 existe una correlación fuerte positiva entre uso semanal (horas) de la
máquina y gastos anuales de mantenimiento (en cientos de dólares )
𝑟 2 =0.8562
El 85.62% de la variabilidad de gastos anuales de mantenimiento (en cientos de
dólares ) es explicada por la variabilidad del uso semanal (horas) de la máquina
Ejercicios explicativos
Se han estudiado las calificaciones de 20 alumnos en dos asignaturas: Matemática (X) y Estadística
(Y ), obteniéndose los siguientes resultados:
Además se sabe que el coeficiente de correlación lineal entre ambas variables es r = 0.90. ¿Qué nota
se puede predecir en la asignatura de Estadística, para un alumno que ha obtenido 14 en Matemática?
Solución
𝑆𝑥𝑦 𝑆𝑥𝑦
𝑟=𝑆 0.9 = 𝑆𝑥𝑦 =2.7
𝑥 𝑆𝑦 2 1.5
𝑆𝑥𝑦 2.7
b= = =0.675
𝑆𝑥2 4
𝑎 =𝑦 − 𝑏𝑥 ; 𝑎 =15-0.675(13)=6.225
𝑌 = 𝑎 + 𝑏𝑥
𝑌 = 6.225 + 0.675𝑋
𝑌 = 6.225 + 0.675 (14)
𝑌 = 15.675 = 16 La nota que se puede predecir en la asignatura de Estadística es de 16
Regresión y correlación lineal
TAREA DOMICILIARIA