Академический Документы
Профессиональный Документы
Культура Документы
REGRESIN
LINEAL
Docente:
Ing. Estadstica Jorsi Balczar Gallo
Dos
variables
pueden
estar
relacionadas de muchas maneras
distintas, y para conseguir algn
proceso o estudio, es de gran ayuda
identificar la relacin que hay entre
ellas.
COVARIANZA
Para las variables estadsticas bidimensionales se define la
covarianza como la media de los productos de las
desviaciones respecto de la media de cada una de las
variables componentes.
Esta medida es muy interesante. Mide la dependencia
existente entre ambas variables (en funcin slo de los
datos presentes de la muestra).
Interpretacin:
Segn sea el signo de la covarianza:
Ejemplo:
Los valores de dos variables X: n de horas de
estudio e Y: cursos desaprobados se distribuyen
segn la tabla siguiente:
Recordando
X
1
14
23
17
23
CORRELACIN
LINEAL
COEFICIENTE DE CORRELACION DE
PEARSON
Se llama correlacin a la teora que trata de estudiar la relacin o
asociacin lineal que existe entre las dos variables que intervienen
en una distribucin bidimensional.
El coeficiente de correlacin lineal es el cociente entre la
covarianza y el producto de las desviaciones tpicas de ambas
variables.
El coeficiente de correlacin lineal se expresa mediante la letra r.
Cov( x, y) sxy
r
sx s y
sx s y
S XY
n n
xi yi
i
xi yi i 1 i 1
n
i 1
n 2
xi
i
S X xi2 i 1
n
i 1
n 2
yi
i
SY yi2 i 1
n
i 1
xy n x y
_
2
( x n x )( y n y )
2
Interpretacin
0,00
0,10 a 0,19
0,20 a 0,39
0,40 a 0,69
0,70 a 0,99
1,00
Diagrama de dispersin
Representacin grfica de la relacin entre
variables cuantitativas. Primer indicio de la forma o
naturaleza de la relacin entre variables. Para el
caso de dos variables tenemos:
Lineal positiva
Lineal negativa
No lineal
Ninguna relacin
r=0.9
r=0.8
r=1
r=0.4
4.07
17.41
2.51
22.25
1.25
106.84
14.67
14.41
16.02
24.18
3.81
29.73
9.87
35.95
1.27
61.81
1.8
48.36
1.5
78.74
1.68
66.42
2.72
121.95
x2
y2
xy
4.07
17.41
16.56
303.11
70.86
2.51
22.25
6.30
495.06
55.85
1.25
106.84
1.56
11414.79
133.55
14.67
14.41
215.21
207.65
211.39
16.02
24.18
256.64
584.67
387.36
3.81
29.73
14.52
883.87
113.27
9.87
35.95
97.42
1292.40
354.83
1.27
61.81
1.61
3820.48
78.50
1.8
48.36
3.24
2338.69
87.05
1.5
78.74
2.25
6199.99
118.11
1.68
66.42
2.82
4411.62
111.59
2.72
121.95
7.40
14871.80
331.70
61.17
628.05
625.53
46824.12
2054.06
x 5.0975
y 52.3375
Reemplazando,
0.23
Ejemplo Propuesto
estudios de regresin.
Objetivo
Estudio de la relacin funcional entre dos
variables.
Establecer una relacin cuantitativa entre dos o
ms variables relacionadas.
REGRESIN
LINEAL SIMPLE
Ecuacin de la recta
EJEMPLO 1:
El dueo de una licorera est interesado en medir el efecto del
precio de las cajas de whisky escocs sobre la cantidad vendida.
Los resultados de la tabla adjunta se obtuvieron de una muestra
aleatoria de las ventas de ocho semanas. El precio est medido en
dlares y las ventas en cajas:
PRECIO
192
205
197
213
208
199
178
172
VENTAS
25
14
18
12
11
15
29
35
Resolviendo:
Totales
Precio
Ventas
X*Y
X2
192
25
4800
36864
205
14
2870
42025
197
18
3546
38809
213
12
2556
45369
208
11
2288
43264
199
15
2985
39601
178
29
5162
31684
172
35
6020
29584
1564
159
30227
307200
X 1564 / 8 195.5
_
Y 159 / 8 19.875
XY n X Y 30227 8 195.5 19.875
0.5963
307200 8 195.5
X n X
_ _
Y 136.4545 0.5963x
Ejemplo 2
Una compaa farmacutica conduce un estudio
piloto para evaluar la relacin entre tres dosis
de un nuevo agente hipntico y tiempo de
sueo. Los resultados son presentados en la
siguiente tabla.
Y
X
Clculos previos
Interpretacin:
Por cada
1 nM/kg en la dosis del agente
hipntico, el tiempo de sueo aumenta en 0.5
horas.
R 2 81.07%
Interpretacin:
1. El tiempo de sueo est explicado en un
81.07% por la dosis del agente hipntico
ingerida.
2. El modelo explica en 81.07% el tiempo de
sueo.
EJEMPLO PROPUESTO:
Los datos de la siguiente tabla representan las estaturas (X,
cm) y los pesos (Y, kg) de una muestra de 12 hombres
adultos. Para cada estatura fijada previamente se observ el
peso de una persona seleccionada de entre el grupo con dicha
estatura, resultando:
Se obtiene:
Esta relacin se ha estimado en un R = 93.7, que indica una fuerte
relacin positiva.
Adems si consideramos el coeficiente de determinacin R = 87.9
podemos indicar que el 87.9% de las variaciones que ocurren en el
peso se explicaran por las variaciones en la variable estatura.
REGRESIN
LINEAL
MLTIPLE
para i = 1,2,.n
siendo
la matriz columna de coeficientes
estimados, Y la matriz columna de observaciones de
la variable dependiente y X la denominada matriz de
diseo.
Ejercicio Propuesto
Una cadena de restaurantes de comida rpida decide llevar a
cabo un experimento para medir la influencia sobre las ventas
del gasto en publicidad. En ocho regiones del pas se realizaron
diferentes variaciones relativas en el gasto de publicidad,
comparado con el ao anterior, y se observaron las variaciones
en los niveles de ventas resultantes. La tabla adjunta muestra
los resultados:
INCREMENTO DEL
GASTO
EN PUBLICIDAD %
INCREMENTO EN LAS
VENTAS %
14
10
2.4
7.2
10.3
9.1
10.2
4.1
7.6
3.5
Fin