Вы находитесь на странице: 1из 5

II UNIDAD

ANÁLISIS DE REGRESIÓN LINEAL, ANALISIS DE CORRELACIÓN Y


PROBABILIDADES.
Análisis de regresión y correlación.

El análisis de las relaciones existentes entre dos o más variables requiere en la mayoría de las ocasiones de
tratamiento estadístico debido a que:

• La estructura verdadera de la relación no es conocida.

• No existe dependencia funcional exacta entre las variables consideradas.

Análisis de regresión

El análisis de regresión consiste en emplear métodos que permitan determinar la mejor relación funcional entre la
variable dependiente Y con respecto a la variable independiente X con el fin de predecir el valor de Y si se conoce
los valores de la otra variable asociada.

Diagrama de Dispersión.

Se denomina diagrama de dispersión o nube de puntos; a la representación gráfica de puntos dispersos sobre el
plano cartesiano.

El conjunto de observaciones  xi , yi  , tal que xi  X , yi  Y forma el diagrama de dispersión.


.

El diagrama de dispersión nos permite apreciar si hay o no una relación entre las variables X, Y.

Existe una relación lineal entre Existe una relación no lineal No existe ninguna relación entre
las variables X, Y. entre las variables X, Y. las variables X, Y
Modelo de regresión lineal simple

Cuando la relación funcional entre las variables dependiente (Y) e independiente (X) es una línea
recta, se tiene una regresión lineal simple, a partir de una muestra, (x1, y1), (x2, y2), (x3, y3),….
(xn, yn) dada por la ecuación:

y    x 

Donde:
 : El valor de la ordenada donde la línea de regresión se intersecta al eje Y.
 : El coeficiente de regresión poblacional (pendiente de la línea recta)
ε : El error.

Estimación de parámetros por el método de mínimos cuadrados.

La función de regresión lineal simple es expresado como:

y    x 

La estimación de parámetros consiste en determinar los parámetros  y  a partir de los datos


observados; es decir, deben hallarse valores como a y b de la muestra, que represente a  y
 , respectivamente.

Empleando el método de los mínimos cuadrados, es decir minimizando la suma de cuadrados


de los errores, se determinan los valores de a y b, así:

n n n
n  xi y i  x y
n n

SPXY i i  yi x i
b  i 1 i 1 i 1
2 y a i 1
b i 1
 y  bx
SCX n
 n  n n
n  xi    xi 
2

i 1  i 1 
Donde:
a : es el valor de la ordenada donde la línea de regresión se intersecta al eje Y.
b : es el coeficiente de regresión (pendiente de la línea recta).
SPXY : es la suma de productos de X con Y
SCX : es la suma de cuadrados de X
n : número de datos de cada variable

Luego, la ecuación de regresión es:

y ab x Re cta de regresión lineal simple de y sobre x


Nota:

1. El coeficiente de regresión (b). Pendiente de la recta de regresión, representa la tasa de


cambio de la respuesta Y al cambio de una unidad en X.

2. Si b=0, se dice que no existe relación lineal entre las dos variables.

3. Esta recta que mejor se ajusta a los datos de la muestra, sirve para estimar o predecir los
valores de y sobre x.
Es decir: 𝑦̂ = 𝑎 + 𝑏𝑥𝑖

𝑦̂ : Es el valor ajustado o pronosticado de y cuando x = xi.

Ejemplo:

1. En un departamento de producción se desea examinar la relación entre el número de


trabajadores y el número de unidades producidas. A continuación se presenta el conjunto
completo de pares de observaciones.

Producción en una hora


Cantidad de empleados
(unidades)
2 15
4 25
1 10
5 40
3 30

a) ¿Cuál es la variable dependiente, y cual la independiente?


b) Trace el diagrama de dispersión.
c) Determinar la ecuación de regresión lineal.

SOLUCION

a) ¿Cuál es la variable dependiente, y cual la independiente?


Y: Producción en una hora
X: Cantidad de empleados.
b) Trace el diagrama de dispersión.

Producción de articulos por hora según la


cantidad de empleados.
45
40
unidades producidas

35
30
25
20
15
10
5
0
0 1 2 3 4 5 6
cantidad de empleados

c) Determinar la ecuación de regresión lineal.

i X Y XY X2
1 2 15 30 4
2 4 25 100 16
3 1 10 10 1
4 5 40 200 25
5 3 30 90 9
TOTAL 15 120 430 55

𝒏 ∑ 𝒙𝒚−∑ 𝒙 ∑ 𝒚 𝟓(𝟒𝟑𝟎)−𝟏𝟓(𝟏𝟐𝟎)
𝒃= 𝟐 = = 𝟕. 𝟗𝟐𝟑𝟏
𝒏 ∑ 𝒙𝟐 −(∑ 𝒙) 𝟓(𝟓𝟓)−(𝟏𝟓)𝟐

𝑎 = 𝑦̅ − 𝑏𝑥̅ = 0.3846

Por tanto, con estos valores hallados determinamos la ecuación de regresión lineal simple.
Como sigue;

𝑦 = 𝑎 + 𝑏𝑥 → 𝑦 = 0.3846 + 7.9231𝑥

EJERCICIOS DE APLICACIÓN N° 1

1. El profesor Isaac Asimov fue uno de los escritores más prolíficos de todos los tiempos. Antes
de su muerte, escribió casi 500 libros durante una carrera de 40 años. De hecho, cuando su
carrera avanzaba, fue incluso más productivo en términos del número de libros escritos en
un periodo determinado. Los datos siguientes dan el tiempo, en meses, necesario para
escribir sus libros en incrementos de 100:

Numero de libros x 100 200 300 400 490


Tiempo en meses y 237 350 419 465 507
a) Suponga que el número de libros x y el tiempo en meses y están relacionados
linealmente. Encuentre la recta de mínimos cuadrados que relacione y con x.
b) Grafique el tiempo como función del número de libros escritos usando una gráfica de
dispersión y grafique la recta de mínimos cuadrados en el mismo papel. ¿Le parece que
la recta da un buen ajuste a los puntos?

2. Suponga que los datos siguientes sean una muestra de salarios y bonos anuales de 10
vicepresidentes de ventas. Los datos se dan en miles de dólares.

Vicepresidente 1 2 3 4 5 6 7 8 9 10
Salario 135 115 146 167 165 176 98 136 163 119
Gratificación 12 14 16 19 22 24 7 17 18 11

a) Trace un diagrama de dispersión con estos datos tomando como variable independiente
los salarios.
b) ¿Qué indica el diagrama de dispersión del inciso a) acerca de la relación entre salario y
gratificación?
c) Use el método de mínimos cuadrados para obtener la ecuación de regresión estimada.

Вам также может понравиться