Академический Документы
Профессиональный Документы
Культура Документы
El análisis de las relaciones existentes entre dos o más variables requiere en la mayoría de las ocasiones de
tratamiento estadístico debido a que:
Análisis de regresión
El análisis de regresión consiste en emplear métodos que permitan determinar la mejor relación funcional entre la
variable dependiente Y con respecto a la variable independiente X con el fin de predecir el valor de Y si se conoce
los valores de la otra variable asociada.
Diagrama de Dispersión.
Se denomina diagrama de dispersión o nube de puntos; a la representación gráfica de puntos dispersos sobre el
plano cartesiano.
El diagrama de dispersión nos permite apreciar si hay o no una relación entre las variables X, Y.
Existe una relación lineal entre Existe una relación no lineal No existe ninguna relación entre
las variables X, Y. entre las variables X, Y. las variables X, Y
Modelo de regresión lineal simple
Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es una línea
recta, se tiene una regresión lineal simple, a partir de una muestra, (x1, y1), (x2, y2), (x3, y3),….
(xn, yn) dada por la ecuación:
y x
Donde:
: El valor de la ordenada donde la línea de regresión se intersecta al eje Y.
: El coeficiente de regresión poblacional (pendiente de la línea recta)
ε : El error.
y x
n n n
n xi y i x y
n n
SPXY i i yi x i
b i 1 i 1 i 1
2 y a i 1
b i 1
y bx
SCX n
n n n
n xi xi
2
i 1 i 1
Donde:
a : es el valor de la ordenada donde la línea de regresión se intersecta al eje Y.
b : es el coeficiente de regresión (pendiente de la línea recta).
SPXY : es la suma de productos de X con Y
SCX : es la suma de cuadrados de X
n : número de datos de cada variable
2. Si b=0, se dice que no existe relación lineal entre las dos variables.
3. Esta recta que mejor se ajusta a los datos de la muestra, sirve para estimar o predecir los
valores de y sobre x.
Es decir: 𝑦̂ = 𝑎 + 𝑏𝑥𝑖
Ejemplo:
SOLUCION
35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
cantidad de empleados
i X Y XY X2
1 2 15 30 4
2 4 25 100 16
3 1 10 10 1
4 5 40 200 25
5 3 30 90 9
TOTAL 15 120 430 55
𝒏 ∑ 𝒙𝒚−∑ 𝒙 ∑ 𝒚 𝟓(𝟒𝟑𝟎)−𝟏𝟓(𝟏𝟐𝟎)
𝒃= 𝟐 = = 𝟕. 𝟗𝟐𝟑𝟏
𝒏 ∑ 𝒙𝟐 −(∑ 𝒙) 𝟓(𝟓𝟓)−(𝟏𝟓)𝟐
𝑎 = 𝑦̅ − 𝑏𝑥̅ = 0.3846
Por tanto, con estos valores hallados determinamos la ecuación de regresión lineal simple.
Como sigue;
𝑦 = 𝑎 + 𝑏𝑥 → 𝑦 = 0.3846 + 7.9231𝑥
EJERCICIOS DE APLICACIÓN N° 1
1. El profesor Isaac Asimov fue uno de los escritores más prolíficos de todos los tiempos. Antes
de su muerte, escribió casi 500 libros durante una carrera de 40 años. De hecho, cuando su
carrera avanzaba, fue incluso más productivo en términos del número de libros escritos en
un periodo determinado. Los datos siguientes dan el tiempo, en meses, necesario para
escribir sus libros en incrementos de 100:
2. Suponga que los datos siguientes sean una muestra de salarios y bonos anuales de 10
vicepresidentes de ventas. Los datos se dan en miles de dólares.
Vicepresidente 1 2 3 4 5 6 7 8 9 10
Salario 135 115 146 167 165 176 98 136 163 119
Gratificación 12 14 16 19 22 24 7 17 18 11
a) Trace un diagrama de dispersión con estos datos tomando como variable independiente
los salarios.
b) ¿Qué indica el diagrama de dispersión del inciso a) acerca de la relación entre salario y
gratificación?
c) Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada.